Сегодня 26 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → алиса

В «Алису» встроили нейросеть YandexGPT, которая пишет тексты и генерирует идеи «как разбирающийся человек»

Команда разработчиков «Яндекса» объявила о включении большой языковой модели нового поколения YandexGPT в состав виртуального помощника «Алиса». Как сообщает пресс-служба компании, нейросеть способна писать тексты и генерировать идеи «почти так же хорошо, как разбирающийся в теме человек».

Источник изображения:

Источник изображения: "Яндекс"

Благодаря тому, что «Алиса» присутствует в огромном числе устройств, новая технология появилась в базовом приложении «Яндекса», в браузере, колонках-станциях и умных телевизорах. Для того чтобы поставить «Алисе» творческую задачу, достаточно обратиться к ней: «Алиса, давай придумаем!», после чего она займётся поиском подходящего решения. Благодаря использованию нейросети виртуальный ассистент поможет придумать заголовок, составить сценарий для мероприятия, план путешествия и даже текст делового письма. Можно попросить нейросеть подобрать наилучший подарок.

Источник изображения:

Источник изображения: "Яндекс"

По словам разработчиков, пока «Алиса» не запоминает контекст диалога и даёт ответы, не обращая внимания на предыдущие реплики. В будущем голосовой помощник научится учитывать контекст беседы.

Источник изображения:

Источник изображения: "Яндекс"

Известно, что YandexGPT обучали на суперкомпьютерах «Яндекса», по данным компании — самых мощных в России и Восточной Европе. Для начала сети предоставили для обучения общедоступные тексты из интернета, отобранные с помощью поисковых алгоритмов «Яндекса». Дообучение проходило на «сотнях тысяч примеров содержательных и хорошо написанных ответов», для подготовки которых использовались технологии краудсорсинга и команда специальных ИИ-тренеров.

По словам разработчика, сегодняшняя премьера является первым шагом на пути обучения нейросети и, следовательно, «Алисы». В перспективе технология будет внедряться в различные сервисы компании, включая поиск. В начале месяца сообщалось о планах «Яндекса» научить «Алису» говорить на разных языках.

«Яндекс» обучит «Алису» говорить на других языках

«Яндекс» начал работу по дополнительному обучению новым языкам своего голосового помощника «Алиса». Ранее проект пришлось приостановить из-за пандемии, однако теперь компания начала набирать специалистов для обучения «Алисы» новым языкам, передаёт «Коммерсант».

 Источник изображения: yandex.ru/alice

Источник изображения: yandex.ru/alice

На странице вакансий «Яндекса» появилась позиция «Разработчик в команду международного движка "Алисы"». Речь идёт о добавлении голосовому помощнику поддержки новых языков с учётом культурной специфики. Сейчас «Алиса» говорит только по-русски, но уже ведётся работа над тем, чтобы ассистент заговорил и на других языках, подтвердили в «Яндексе», но отметили, что все подробности будут оглашены позже.

Поддержка других языков в «Алисе» пока ограничена функциями перевода и поиска, хотя ещё в 2018 году, до дебюта умных колонок серии «Станция», компания планировала добавить полноценную поддержку украинского, белорусского и казахского языков. К сожалению, тогда их реализации помешала пандемия. Помимо России, умные колонки «Яндекса» продаются в Беларуси, Израиле, Казахстане и Узбекистане — в апреле 2023 года к ним добавились смарт-телевизоры с «Алисой». За всё время существования проекта было продано 6 млн устройств, и только в I квартале 2023 года доход от сегмента составил 6,1 млрд руб. с ростом на 172 %. Разрабатывающие собственных голосовых помощников VK, SberDevices и МТС о планах добавить поддержку отличных от русского языков пока не сообщали.

Устройства от «Яндекса» могли бы стать популярнее с поддержкой национальных языков в странах продаж, поэтому её отсутствие является сдерживающим фактором, а поддержка, например, испанского помогла бы компании выйти на рынки Южной Америки, где у компании уже есть некоторое присутствие, считают опрошенные «Коммерсантом» эксперты. Кроме того, в дополнительном обучении голосового помощника должны принимать участие носители соответствующих языков, знакомые с зарубежными культурами, и, возможно, придётся внести некоторые коррективы в игривый характер «Алисы» — в некоторых странах он может показаться неуместным.

«Яндекс» нашёл в утекшем коде функцию скрытного включения микрофона у «Алисы»

Компания «Яндекс» представила первые результаты расследования утечки почти 45 Гбайт исходных кодов её проектов, которая произошла на прошлой неделе. Компания извинилась за случившееся, снова подтвердила подлинность утекших данных и рассказала, какие проблемы благодаря инциденту удалось выявить: начиная от тайных функций «Алисы» и заканчивая использованием «костылей» и расистских слов в коде.

«Яндекс» отметил, что опубликованные исходные коды действительно взяты из внутреннего репозитория компании, но соответствуют решениям из устаревшей версии репозитория. Другими словами, данные исходные коды отличаются от тех, которые используются сервисами «Яндекса» сейчас.

Наиболее пугающе выглядит признание «Яндекса», что в утекшем коде нашёлся фрагмент, который скрытно включает микрофон устройства с голосовым ассистентом «Алиса». Компания заверяет, что это тестовая версия алгоритма, и публичной она не была. Однако существует как минимум возможность включения такой функции на любом, в том числе пользовательском устройстве.

В заявлении компании сказано: «Опубликованные фрагменты кода содержат в том числе и тестовые алгоритмы, которые использовались только внутри "Яндекса" для проверки корректности работы сервисов. Например, для улучшения качества активации ассистента и уменьшения количества ложных срабатываний в бета-версии для сотрудников применяется настройка, которая включает микрофон устройства на несколько секунд в случайный момент без упоминания Алисы».

Ещё «Яндекс» сообщила, что благодаря инциденту выявила ряд нарушений её политик. Например, в коде нашлись контактные данные некоторых партнёров, в том числе водителей: контакты и номера водительских удостоверений передавались из одного таксопарка в другой. В сервисе «Яндекс Лавка» обнаружилась возможность ручной настройки рекомендаций любых товаров без добавления пометки о том, что данные рекомендации являются рекламными. А в сервисах Такси и Еда у отдельных групп пользователей оказалась приоритетная поддержка.

Ещё выяснилось, что разработчики «Яндекса» грешили использованием «костылей» — временных неоптимальных решений — для изменения логики работы сервисов вместо алгоритмов. Через такие временные решения исправляли отдельные проблемы в системе, отвечающей за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео.

Наконец, компания призналась, что «некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но были сами по себе оскорбительны для людей разных рас и национальностей». Речь идёт об использовании расистских слов в коде.

Компания отметила, что теперь изменит подход к разработке своих продуктов таким образом, чтобы сократить использование «костылей». Ещё компания пообещала сформировать новые стандарты и принципы технологической этики, и исправит фрагменты кода, которые будут им противоречить. Ещё было отмечено, что внутренняя среда разработки останется открытой и сохранится единый репозиторий. Также часть данных, которые не имеют отношения к алгоритмам и настройкам сервисов, получат дополнительную защиту.


window-new
Soft
Hard
Тренды 🔥
Google применила конкурирующего ИИ-бота Anthropic Claude для улучшения своих нейросетей Gemini 17 мин.
Apple призналась, что выполняет требования российского законодательства 49 мин.
Платформер Restitched отправит исследовать и создавать красочные миры — геймплейный трейлер духовного наследника LittleBigPlanet 2 ч.
Apple объяснила, почему не хочет создавать собственный поисковик на замену Google 2 ч.
«Не думаю, что Nintendo это стерпит, но я очень рад»: разработчик Star Fox 64 одобрил фанатский порт культовой игры на ПК 12 ч.
Корейцы натравят ИИ на пиратские кинотеатры по всему миру 14 ч.
В Epic Games Store стартовала новая раздача Control — для тех, кто дважды не успел забрать в 2021 году 16 ч.
За 2024 год в Steam вышло на 30 % больше игр, чем за прошлый — это новый рекорд 17 ч.
«Яндекс» закрыл почти все международные стартапы в сфере ИИ 18 ч.
Создатели Escape from Tarkov приступили к тестированию временного решения проблем с подключением у игроков из России — некоторым уже помогло 18 ч.
Индийский RISC-V стартап Mindgrove привлек на развитие $8 млн 13 мин.
Пример Tesla заразителен: китайский производитель электромобилей Li Auto начнёт выпускать человекоподобных роботов 16 мин.
Apple намерена полностью разорвать отношения с Nvidia 22 мин.
Во флагманских смартфонах Huawei Mate 70 нашли память SK hynix, которой там быть не должно 3 ч.
Чтобы решить проблемы с выпуском HBM, компания Samsung занялась перестройкой цепочек поставок материалов и оборудования 5 ч.
Новая статья: Обзор и тест материнской платы Colorful iGame Z790D5 Ultra V20 11 ч.
Новая статья: NGFW по-русски: знакомство с межсетевым экраном UserGate C150 12 ч.
Криптоиндустрия замерла в ожидании от Трампа выполнения предвыборных обещаний 12 ч.
Открыт метастабильный материал для будущих систем хранения данных — он меняет магнитные свойства под действием света 14 ч.
Новый год россияне встретят под «чёрной» Луной — эзотерика ни при чём 17 ч.