Оба этих понятия применяются в программе Advego Plagiatus. Это программа, которая проверяет тексты на уникальность содержания (контента). То есть, говоря простым языком, проверяет скопирован ли текст с сайтов или придуман.
Размер шингла - это количество слов, по которым осуществляется проверка на наличие совпадений на других сайтах. То есть например если размер шингла будет 1, то 100% найдётся хоть одно совпадение, если конечно вместо слова не написана какая-нибудь билибирда. Если равен двум, то тоже большой шанс на совпадения, но уже меньше.
Например, есть предложение:
Собака побежала гулять по размокшей от дождя почве.
Если размер шингла равен 1, то Advego Plagiatus начнёт искать совпадения со словом Собака и 100% их найдёт.
Если шингл равен 2, то будет искать совпадения с фразой Собака побежала и тоже 100% найдёт.
Если, допустим, размер шингла будет 5, то будут искаться такие фразы:
Собака побежала гулять по размокшей
Тут может найдёт, а может и нет, всё зависит от того, написал ли кто-нибудь где-нибудь такую фразу или нет.
То есть чем больше размер шингла, тем меньше строгость проверки, так как меньше вероятность совпадения с уже существующим контентом.
Размер фразы - это количество слов, посылаемых программой Advego Plagiatus поисковой системе для проверки данной фразы на уникальность. Программа Advego Plagiatus как бы спрашивает у поисковика, не написана ли данная фраза на каком-нибудь из сайтов и получает от него ответ.
Лично я особо не вижу разницы в смысле размера шингла и размера фразы. Может вы найдёте. Вот что пишет по этому поводу сам Адвего: