много мата 🤬 — Meduza
На прошлой неделе произошла масштабная утечка исходного кода сервисов «Яндекса» (компания сама ее подтвердила). Неизвестный обнародовал архивы внутреннего репозитория «Яндекса». Изучив их, можно узнать много новых деталей о том, как устроен крупнейший российский поисковик, который в последние годы постоянно критикуют за сотрудничество с Кремлем. Из утечки, в частности, выяснилось, что «Яндекс» цензурирует поисковую выдачу картинок и видео — так, чтобы изображения Путина и символы Z не появлялись в неприятных для властей контекстах.
Утечка «Яндекса» состоит из 83 архивов, общий объем которых в сжатом виде превышает 40 гигабайт. Ссылки на конкретные файлы из утечки в этом материале «Медузы» оформлены с указанием архива и пути к файлу внутри этого архива (ищите этот адрес в сносках). Вот так:
архив.tar.bz2: путь/к/файлу.txt
Цензурирование запросов пользователей
Когда вы ищете картинки в «Яндексе», в некоторых случаях ваш поисковый запрос автоматически корректируется: компания изымает часть изображений из поисковой выдачи.
За это отвечает специальное правило внутреннего сервиса «Бегемот» под названием ImgPatch (дословно — исправление изображений). Вот такое описание этого правила можно увидеть в его коде:
Позволяет организовать быстрый бан картинок и видео при помощи правки исходных запросов. От небольших изменений до полной переформулировки.
search.tar.bz2: wizard/data/fresh/img_patch/images2.txt
В первых десяти строках текстового файла на скриншоте описана логика правил ImgPatch. «Яндекс» может переписывать запрос пользователя (rewrite) или добавлять к нему какие-то аргументы (patch): например, заминусовывать отдельные слова, чтобы наверняка изъять их из выдачи.
Эти правила можно применять ко всем запросам (*) или ограничить каким-то сегментом интернета — например, российским (tld=ru), белорусским (tld=by) или украинским (tld=ua). Некоторые правила должны срабатывать только при отсутствии конкретного уточнения в запросе (anti marker word).
Попробуем объяснить логику таких исправлений на примерах из файла с тестовыми запросами для проверки их работы.
зелёный слоник -фильм,-видео,-кино patch -«зелёный слоник» -«zeleniy slonik»
Если пользователь ввел в поисковую строку запрос с фразой зеленый слоник, но не уточнил, что ищет видео или кино, то исправление запроса должно гарантировать, что он не наткнется случайно на кадры из одноименного культового треш-фильма.
президент allow-exact,-медведев patch -«Медведев»
Это правило должно помочь россиянам забыть, что заместитель председателя Совбеза РФ Дмитрий Медведев тоже был президентом. Если только пользователь специально не попросит архивные фото президента Медведева.
Чаще всего исправления применяются для того, чтобы убрать из выдачи «Яндекса» порнографические фото и видео (особенно детские). На втором месте по количеству заведенных правил — изъятие изображений президента РФ Владимира Путина. Раньше других на это обратил внимание пользователь твиттера @bantg.
Защита Путина
«Яндекс» постарался, чтобы на изображение действующего российского президента нельзя было наткнуться при поиске по отдельным словам:
- пиздабол
- плешивый
- хуйло / хуйла / хуйлы / хуило / хуила
А также словосочетаниям:
- бункерный дед
- главный вор
- гондон всея руси
- хуй в скафандре
- xуйло в проруби
И целым предложениям:
- как выглядят педофилы
- когда он сдохнет
- странное создание машет рукой
search. tar.bz2: wizard/data/fresh/img_patch/images2.txt
search.tar.bz2: wizard/data/fresh/img_patch/video2.txt
Все эти правила должны применяться вне зависимости от того, где находится пользователь.
Эти правила должны применяться вне зависимости от того, в какой стране находится пользователь. Мы не знаем, когда они появились и действуют ли до сих пор. Перед выходом этого материала нам удалось найти изображения российского президента в поиске «Яндекса» по всем запросам, кроме хуй в скафандре (если не уточнять, что мы ищем именно Путина).
«Медуза» в России теперь не только «иноагент», но еще и «нежелательная» организация. Этот статус гораздо хуже прежнего. Тем не менее мы продолжаем работать. Нас по-прежнему можно читать. Это безопасно. Здесь — все ответы на тревожные вопросы.
Защита символа Z
«Яндекс» оберегает от неприятных ассоциаций и букву Z, ставшую символом российской войны против Украины (и запрещенную в некоторых европейских государствах). Пользователи «Яндекса» не должны увидеть символику нацистской Германии по запросам со словами символ z или z спецоперация логотип. Для этого «Яндекс» автоматически добавляет к ним множество разных заминусованных слов:
символ z * patch -luftwaffe -знак -люфтваффе -emblems -немецкий -german -президент -германский -славянский -army -рейх -вермахт -symboly -нацисты -германия -ss -hitler -nazi -сша -us -germany -сс -postimages -калмыкия -крест -членский -гитлерюгенд -message -ww2 -symbol -фон
z спецоперация логотип * patch -азов -spartan -япония -всу -одесса -спецуха -blackwood -спецназ -фарм -сша -ссо -warface -csgo
Проверить, функционирует ли правило до сих пор, труднее. В случае с Путиным программа должна блокировать изображение президента РФ, если пользователь ищет конкретное слово, словосочетание или предложение. В случае с Z искать программе приходится «запрещенные» символы, что сложнее. Наберите в поиске символ z или z спецоперация логотип — и вы можете встретить в выдаче, например, свастику; но неизвестно, связано ли это с тем, что фильтр уже выключен или он просто плохо работает.
Два последних слова в черном списке капчи
В утечке можно найти списки запрещенных и разрешенных слов для использования в капче «Яндекса».
Запретный список начинается со слов пиндосы!, смерть, смертью, google — а заканчивается словами львов и сдаться. Он не отсортирован по алфавиту: отдельные новые запретные слова или списки, скорее всего, записывали в конец файла.
captcha.tar.bz2: data/blacklist_ru.txt
Оба последних слова, по-видимому, внесли в список после начала полномасштабного вторжения России в Украину. Слово сдаться могли забанить, чтобы его случайно не расценили как скрытый призыв; попадание в список слова львов также трудно объяснить вне военного контекста. Ни в черном, ни в белом списке нет имен собственных, но львов — это одновременно и название города на западе Украины, и родительный падеж множественного числа слова «львы». Ни в каких других формах (львы, львам, львами, львах) это слово в черном списке не встречается, а в белом, наоборот, можно найти это слово в другой форме (львам), а также несколько однокоренных (львиная, львиного и др. ).
Так что, по всей вероятности, внести слово львов в запрещенный список могли только из-за его омонима — города Львова, который подвергается ракетным ударам российских войск с самого начала войны.
Обновлено. «Яндекс» 30 января опубликовал первые результаты своего расследования утечки исходного кода. В них говорится, в частности, что в некоторых случаях логику работы сервисов корректировали не алгоритмическим способом, а «костылями». «Через такие „костыли“ исправляли отдельные ошибки системы рекомендаций, которая отвечает за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео», — заявила компания.
Денис Дмитриев
Операторы поисковых систем — используем поиск по максимуму.
Поисковые операторы (специальные символы, которые добавляют к поисковому запросу) помогают получить огромное количество полезной информации о сайте. С их помощью можно существенно сузить диапазон поиска и найти нужную информацию. В основном, операторы в разных поисковых системах совпадают, но есть и различия. Поэтому рассмотрим операторы для Google и Яндекс по отдельности.
Операторы Google
Рассмотрим для начала простейшие операторы:
+ – оператор «плюс» используется для нахождения слов в одном предложении, просто вставьте данный символ между словами. Например, сделав запрос типа «зимние + шины + для + ниссана», вы получите в выдаче те сайты, в которых есть предложения с полным набором всех слов из запроса.
– – оператор «минус» поможет исключить из запроса нежелательные слова. Например, если сделать запрос «Крестный отец –онлайн», то вам выдадут сайты с информацией о фильме, обзором, рецензией и т.д., но исключат сайты с онлайн просмотром.
.. – поможет для поиска результатов, содержащих числа в указанном диапазоне.
@ и # – символы для поиска по тегам и хештегам социальных сетей.
OR – оператор «или», с его помощью можно найти страницы на которых встречается хотя бы одно из нескольких слов.
« » – кавычки сообщают поисковику, что вам необходимо найти сайты, где введенные слова находятся в указанном порядке – точное вхождение.
Сложные операторы:
site: поможет найти необходимую информацию на конкретном сайте.
cache: полезный оператор в случае если содержимое какой-либо страницы изменилось или было заблокировано. Покажет кешированную версию. Пример: cache:1ps.ru
info: служит для показа всей информации об адресе.
related: отличный оператор для поиска сайтов с похожим контентом.
allintitle: выводятся страницы, у которых в теге title присутствуют указанные в запросе слова
allinurl: великолепный оператор, с помощью которого можно найти действительно нужные страницы. Показывает сайты, содержащие в адресе страницы указанные слова. К сожалению, всё еще мало сайтов в российском сегменте интернета используют кириллицу, поэтому придется использовать либо транслитерацию, например, allinurl:steklopakety, либо латиницу.
inurl: делает тоже самое что и оператор выше, но отбор происходит только для одного слова.
allintext: выборка страниц производится именно по содержимому страницы. Может быть полезно, если вы ищете какую-то информацию, но адрес сайта просто напросто забыли.
intext: тоже самое только для одного слова.
allinanchor: оператор показывает страницы, у которых в описании есть ключевые слова. Например: allinanchor: часы наручные.
inanchor: тоже самое только по одному ключевому слову.
Операторы Яндекс
Простые операторы:
! – ставится перед ключевым словом и в результатах поиска выдаются страницы, где указано точно такое же слово (без изменений словоформы).
+ – так же как и у Google, отображаются страницы со всеми словами, указанными между плюсом.
« » – показывает точное совпадение фразы.
( ) – используется для группировки слов в сложных запросах.
& – нужен для поиска страниц, в которых слова, объединенные данным оператором, встречаются в одном предложении.
* – служит для поиска пропущенных слов в цитатах. Например: Россия * душа. Один оператор * заменяет одно слово.
Следующие операторы уже встроены в расширенный поиск Яндекса, поэтому запоминать их нет смысла, но всё же мы объясним, что каждый из них делает.
title: поиск по заголовкам страниц сайтов
url: поиск по страницам, размещенным по заданному адресу, например url:1ps.ru/blog/*
host: производит поиск по всему хосту.
site: здесь поиск производится уже по всем поддоменам и страницам сайта.
inurl: поиск по страницам только данного домена с применением ключевых слов. Например, inurl:1ps.ru блог
mime: поиск документов заданного типа, например mime:xls.
cat: поиск по сайтам, которые присутствуют в Яндекс.Каталоге, а также регион и рубрика которых совпадает с заданным. Например: автомобиль cat:ID_категории
Вот как эти операторы выглядят в самом поисковике:
Таким образом, правильно подбирая и используя операторы поисковых систем Google и Яндекс, вы можете самостоятельно составить семантическое ядро для сайта, найти недочеты и ошибки в работе, сделать анализ конкурентов, а также узнать – откуда и какие внешние ссылки идут на ваш сайт.
Если вы используете в работе еще какие-то операторы, которые мы не учли, делитесь в комментариях. Обсудим =)
Yandex Games — Скачать APK для Android
Скачать
1/12
Описание Yandex Games: One Stop Gateway
Яндекс Игры — это универсальный лаунчер с обширным каталогом игр, которыми можно наслаждаться онлайн
Огромный выбор видеоигры.
В каталоге Яндекса представлено множество наименований, так что не стесняйтесь выбирать любую из более чем 10 000 перечисленных позиций. Развивайте мощную бизнес-империю, стройте потрясающие города и фермы, зарабатывайте горы золота в открытом фэнтезийном мире и участвуйте в захватывающих гонках!
Синхронизация между устройствами.
Доступ к сохраненным состояниям, достижениям и прогрессу на всех ваших устройствах, если у вас есть учетная запись Яндекса. Благодаря синхронизации между устройствами вы всегда сможете продолжить с того места, на котором остановились, независимо от того, где вы находитесь и какое устройство используете.
Интеллектуальная подача.
Алгоритм Smart Feed делает умные предложения на основе ваших интересов.
Мы разделили наши предложения на жанры и категории, такие как:
Настольные игры.
Сыграйте в шахматы онлайн или станьте королем домино. Подключитесь к своему онлайн-противнику и сразитесь с любым, кто посмеет противостоять вам! Вы также найдете лудо, крестики-нолики или пасьянс. Проверьте свои навыки в шашках, четырех в ряд и нардах с друзьями на вечеринке!
Игры в слова.
Если вы хотите похвастаться своим богатым словарным запасом, нет лучшего способа сделать это, чем играть в поиск слов и словесные головоломки с друзьями или семьей. Попробуйте угадать их ответ! Идти на это в одиночку? Тогда ищите не дальше кроссвордов!
Гонки.
Запустите эти двигатели и доведите свои навыки дрифта до предела в автосимуляторе и других гоночных играх. Примите вызов, примите участие в настоящем ралли и выиграйте гонку. Освойте вождение автомобиля по городу и наслаждайтесь реалистичным симулятором такси. Предпочитаете управлять двухколесным транспортом вместо вождения автомобиля? Затем станьте симметричным байкером в одной из многочисленных грязных и мобильных мотоциклетных игр, которые ждут вас внутри.
Мелочи.
Ответьте на вопросы, соедините точки и стимулируйте свой мозг с помощью загадок, математических игр и всевозможных головоломных заданий. Отважитесь пройти тест на IQ прямо сейчас или предпочитаете пройти тест на общие знания? Проверьте свои логические способности и давайте посмотрим, на что вы способны.
Симулятор и холостой ход.
В симуляторе жизни и играх про магнатов оживите свой город или создайте успешный супермаркет, ресторан или даже ферму. Как только ваш бизнес будет запущен и запущен, остановитесь и позвольте нанятой рабочей силе выполнять работу, пока вы перезаряжаетесь. Или вы можете решить все проблемы со строительством, приготовлением пищи и сельским хозяйством самостоятельно, если вы готовы принять вызов. У нас также есть игры-кликеры, симулятор космического полета и многое другое. Итак, если вы хотите построить деревню, создать виртуальную семью или полетать на самолете, у нас есть вы. Спорт.
Станьте всемирно известным футбольным менеджером или сведите счеты с друзьями в игре в гольф. Играйте в бильярд на 8 шаров или онлайн-снукер, не заходя в паб, прямо на своем мобильном устройстве. Попробуйте поиграть в баскетбол, бокс или теннис. Сражайтесь с противниками в боулинге или настольном теннисе. Выиграйте чемпионат лиги и станьте звездой футбола. Вы и ваши друзья также можете создать команду мечты и победить своих противников. Нет никаких ограничений!
РПГ.
Повысьте уровень своего рыцаря души и поднимите свой меч против смертоносных теневых сил! Предпочитаете магию и заклинания? Это тоже ждет вас в открытом фэнтезийном мире MMORPG. Отправляйте бездействующих героев на поиски славы и совершайте набеги на подземелья — внутри куча золота и другой добычи!
Яндекс Игры: One Stop Gateway — Версия 23.30.1220
(11-03-2023)Другие версии
NovedadesВы нас просили — мы сделали. Яндекс Игры теперь в отдельном приложении. Более 9000 бесплатных онлайн-игр: экшн, стратегии, фермы и многое другое.
¡Todavia no hay reseñas! Para escribir la Primera, .
—
1
Отзывы
¡Buena app garantizada!Esta app ha pasado las pruebas de seguridad devirus, malware y otros ataques maliciosos y no supone ninguna amenaza.
Версия приложения: 23.30.1220 Пакет: ru.yandex.games
23.30.1210
5/3/2023
3K descargas20.5 MB Tamaño
Descargar
23.20.1190
3/3/2023
3K descargas21 MB Tamaño
Descargar
23.20.1150
15.02.2023
3K Descargas21 МБ Tamaño
Descargar
23.20.1100
3/2/2023
3K Descargas21 MB Tamaño
Descargar
23.10. 1090
.9000 2923.9000 29000 29000 29000 29000 29000 29000 29000 29000 29000 29000 29000 29000 29000 22.1032.1000 9000 29000 9000 2 9000 2 9000 29000 9000 2 9000 2 9000 2 9000 2 9000 2 9000 2 9000 2 9000 2. 9000.1031. Descargar
23.10.0920
14/1/2023
3K Descargas20,5 МБ Tamaño
Descargar
22.120.0890
30/12/2022
3K DescargAS20.5 MB TAMA
2
22.120.0840
25/12/2022
3K descargas20.5 MB Tamaño
Descargar
22. 120.0770
14/12/2022
3K descargas20.5 MB Tamaño
Descargar
Apps en la misma categoría
Quizá también te interese…
Разработчики Яндекса использовали расистские оскорбления в исходном коде и адаптированные алгоритмы поиска в пропагандистских целях – AIN.Capital
27 января 2023 г., 18:20
В четверг, 26 января, проприетарный исходный код российского гиганта Яндекса просочился в интернет-сообщество под названием Dumpforums . Компания уже подтвердила утечку российским СМИ. Тем временем несколько специалистов исследовали код и обнаружили тревожные детали, такие как расистские термины в названиях переменных и функций, а также части кода, которые вставляли элементы кремлевской пропаганды в результаты поисковой системы.
Расистские оскорбления в исходном коде Яндекса
реальных фрагментов кода из просочившихся git-репозиториев Яндекса, woweeeee pic. twitter.com/p4dBibyQdS
— 𝕂𝕚𝕣𝕥𝕒𝕟𝕖𝕣 (@Kirtaner) 27 января 2023 г.
код яндекс. Проверить их наличие можно, в частности, в файле Антиробот, в ./scripts/learn/sky_matrixnet.sh
На первом скриншоте видно расовое оскорбление в названии функции stop_n****rs (n- слово), которое завершает зомби-процессы (процессы в системах Unix, которые уже запущены, но все еще присутствуют в списке). Здесь функция должна завершать такие процессы и разработчик Яндекса описал это как прекратить все n****rs . Кроме того, при выполнении этой функции отображается сообщение типа «Пожалуйста, подождите, пока все негры не будут уничтожены». На втором снимке экрана видно, что переменная, ранее известная как slave (западный мир давно отказался от терминологии master/slave), была переименована в n****r.
Пользователи Twitter уже нашли вероятного автора кода: компанию-разработчика Илью Трофимова (и его профиль в Linkedin) по почте на втором из экранов.
Пропаганда в поисковике
Это далеко не все курьезы, которые удалось найти ИТ-сообществу в коде сервисов Яндекса. Например, вот ветка о том, как изменили алгоритмы поиска, чтобы он не выдавал оскорбительные для Путина результаты, а также чтобы люди не видели ассоциаций символа Z с нацистами:
github: переименовывает master в main
тем временем yandex: pic.twitter.com/7bqoGtSQIG
— бантег (@bantg) 27 января 2023 г.
Подробности об утечке
Файлы в архиве датированы 24 февраля 2022 года, и, по словам владельца, были украдены им еще в июле 2022 года. ( Dumpforums — организация украинских хакеров, ранее взявшая на себя ответственность за взлом ряда российских банков и государственных предприятий).
Архив, доступный для скачивания всем желающим, содержит внутренние Git-репозитории с кодом 79 сервисов и проектов Яндекса, а также внутреннюю документацию и ключи доступа к API.
«Яндекс — одна из крупнейших ИТ-компаний России. Внутри страны он предоставляет более широкий спектр услуг, чем Google. Представьте себе одну компанию, которая заменит Google, Uber, Amazon, Netflix и Spotify»,
— отметил в своем блоге разработчик и технический энтузиаст Арсений Шестаков.
Поиск
Войти / Зарегистрироваться
или
Запомнить меня
Нажимая «Войти/Зарегистрироваться» вы соглашаетесь с условиями «Пользовательские соглашения» АЙН.