Специалист по качеству поиска Google Владимир Офицеров заверил «Московские новости», что его компания не использует алгоритмы, использующие личные данные посетителей сети, и объяснил, почему некоторые запросы пользователей остаются без ответа.
— Иногда можно видеть, как поисковик Google отмечает некоторые сайты как вредоносные. Какие ресурсы вы относите к категории небезопасных?
— У Google есть декларация Good software principles, в которой прописано: что бы программа ни делала в системе, она должна дать возможность убрать это из ОС, а также не производить ничего без разрешения пользователя и т.д. Нарушающий такие принципы софт мы считаем программами, которые не ведут себя честно по отношению к людям. Если с какого-то сайта их можно загрузить, то ресурс помечается как небезопасный или удаляется из индекса навсегда. Добросовестным владельцам сайта мы пишем письмо, что у них в такой-то директории находится malware и вредоносную программу следует убрать.
— Как поисковик Google относится к пиратским сайтам? Понижает ли поисковый рейтинг?
— Google — архив информации, а не цензор. Мы выступаем за легальный контент, и если к нам поступают обоснованные жалобы от правообладателей, мы удаляем такой контент.
— Значит ли это, что человеку, который хочет посмотреть в онлайне фильм, выложенный с нарушением авторских прав, лучше пользоваться не Google, а другим поисковиком?
— Я не могу отвечать за качество и принципы работы других поисковиков. Мы заботимся о своих пользователях и понижаем в ранжировании те сайты, на которые поступает много жалоб в связи с пиратским содержанием.
— Почему, если набрать в Google «поисковая система», на первом месте будет показан «Яндекс»?
— Сам факт, что вы набираете этот запрос в Google, говорит о многом.
— Как вы воспринимаете фразу «Я погуглил в «Яндексе» и почему, несмотря на то что название вашей поисковой системы ушло в народ, «Яндекс» все же на первом месте в России?
— Слово «гуглить» неслучайно стало нарицательным. Мы первый и крупнейший поисковик в мире. И в России мы тоже активно развиваемся. Кроме того, для российских пользователей именно Google при поиске в глобальном интернете является основным источником информации.
— Вокруг Google много мифов. Говорят, вы создаете психологический портрет каждого человека в интернете. Говорят, «Google за вами следит».
— У Google нет секретов от пользователей. Мы держим все карты открытыми. Если вы зайдете в профиль своего аккаунта в Chrome, то увидите всю информацию, которую Google может хранить, — запросы, посещенные страницы, язык, географическое положение. У пользователя все под контролем. Если вы просто пользуетесь поиском, то мы о вас почти ничего не знаем, кроме одного — того, что вы искали недавно, а также названия страны и города, из которого вы задаете вопрос. Это требуется для оптимизации, ускорения поиска. Информация не персонализирована, и идентифицировать конкретного человека нельзя. Психологических профилей мы не создаем. Я как инженер поиска не могу получить ни одного байта от сотрудников, занимающихся рекламой. Другими словами, между поиском и рекламой стоит Великая Китайская стена, через которую в Google не просачивается ничего. Алгоритмы, которые мы внедряем в поиск, никогда не используют личные данные.
— У разработчиков поисковой системы никогда не было желания как-то влиять на пользователя через доступный им функционал? Допустим, использовать для этого автозаполнение — «наталкивать» человека на ту или иную мысль.
— Google — это машина. Автозаполнение построено по принципу того, что пользователи чаще всего вводят в поисковую строку. Алгоритм фильтрует только такие вещи, как, например, мат или порнографию. Мы стараемся в автозаполнении не выдавать таких штук. Хотя если вы спросите об этом напрямую, то поисковая машина выполнит свою функцию.
— Но разве конечная цель разработчиков поисковиков не в том, чтобы превратить машину в собеседника человека?
— Конечно, мы думаем о том, чтобы поиск был бы похож на компьютер, с которым можно вести разговор, — своего рода компьютеры из сериала Star track. Правда, как двигаться к этой концепции, пока не очень понятно. На текущий момент, когда машина выдает вам десять страниц результатов поиска, то это десять страниц фактов. А если Google будет вести разговор с вами, то он начнет высказывать мнение. И здесь поднимется вопрос субъективности системы.
— Можете назвать эпохальные изменения, которые пережил поисковик Google с момента его запуска?
— Первое революционное изменение — в результатах поиска мы стали одновременно на одной странице отображать текстовую информацию, картинки, новости, видео. Следующий большой этап — мгновенные ответы на вопросы на поисковой странице. К примеру, введите «погода», и Google тут же напишет, сколько градусов на улице. Последний шаг — внедрение в поисковик «Сети знаний» (Knowledge graph), в которой структурировано порядка 500 млн фактов.
— Кстати, о Knowledge graph. Могут ли у вас возникнуть проблемы с законодательством из-за тех фактов, что есть в вашей «Сети знаний»?
— Мы не создаем контент, мы его только агрегируем. Наша позиция — быть архивом настолько, насколько это резонно возможно. Кроме того, мы всегда действуем в соответствии с законодательством. Конечно, иногда могут возникнуть спорные ситуации. Например, я слышал, что согласно официальной позиции вьетнамского правительства Хо Ши Мин был женат на Коммунистической партии, а наш Knowledge graph выдает информацию о его фактической супруге. Должна ли поисковая машина по требованию правительства Вьетнама это удалять?
— А если в России от вас потребуют удалить какую-то информацию?
— В этом случае существуют стандартные процедуры, основанные на судебных решениях.
— На ваш взгляд, существует ли какой-то критический недостаток всех существующих сейчас поисковых систем?
— Дело не столько в поисковых системах, сколько в недостатке необходимого контента, информации, которую люди ищут. Хотите примеры? Где купить стерлядь в Ижевске? Люди спрашивали у Google и не находили. Оказывается, нет такой страницы в интернете, где об этом бы рассказывалось. Почему такая ситуация? Ума не приложу. Или вот запрос: «что можно сыграть на гитаре без 9-го, 10-го, 11-го и 12-го ладов?».
— Без этих знаний, наверное, можно и прожить.
— Не скажите! Разница в качестве поиска в англоязычном и русскоязычном сегментах интернета существенна. Это означает, что среднестатистический российский пользователь не может найти в интернете информацию, сопоставимую с двадцатью википедиями. И нет крайне важного! Запрос «новости лечения детей с поражением центральной нервной системы в Челябинске» так и остался без ответа. Даже в Бразилии, которая наиболее близка к России по уровню проникновения интернета, с контентом дело обстоит гораздо лучше.
Присоединяйтесь — мы покажем вам много интересного
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев