Google получил патент на алгоритм выявления спам-контента

Google решился на достаточно сомнительный шаг и на этой неделе запатентовал собственный алгоритм оценки качества контента сайта, использующийся для выявления страниц, содержащих низкокачественный или искусственно сгенерированный контент и последующего понижения Page Rank.

Помимо прочего, в патенте дается описание сомнительного или «мусорного» контента, который может находиться на страницах с большим числом часто используемых ключевых слов. Обычно такое содержание страниц генерируется путем: отбора контента, его модификации и случайной нарезки; перевода с другого языка; использования дешевого неквалифицированного труда (например, полученного на рынке Amazon Mechanical Turk).

К отличительным чертам спам-контента также относят синтаксис разговорного стиля, неправильный порядок слов и прочее. Помимо этого в патенте отмечается, что спаммеры стремятся получить прибыль от нецелевого трафика и достигают этого за счет размещения на страницах зашкаливающего количества рекламных объявлений, платных ссылок, а также участия в партнерских программах. Патент включает в себя перечисление целого ряда прочих показателей, критериев и расчетов, благодаря которым лидер поиска производит анализ качества контента.

Напомним, что этой весной Google получил патент на собственный метод выявления ссылочного спама и борьбы с ним. Интернет-гигант заверяет, что полученные патенты обязаны обеспечить пользователей высококачественной и релевантной поисковой выдачей, однако специалисты отрасли не скрывают своего недовольства. По их мнению, запатентовав такие базовые технологии Google пытается обеспечить лишь собственную монополию или попросту рекламирует себя.