Что там у Anthropic и OpenAI? Про нейросети, YandexGPT и Поиск с Нейро (yet another podcast #40)

preview_player
Показать описание
yet another podcast — два года. Ко дню рождения мы подготовили двойной выпуск. Во-первых, про Яндекс Поиск и его обновления. В результатах Поиска появился Нейро. Этот сервис изучает все доступные знания интернета и объединяет информацию из нескольких источников в один ответ.

Во-вторых, про YandexGPT 4. Новая генеративная текстовая модель понимает более длинный контекст и даёт ответы через цепочку рассуждений. Нейросеть отвечает на запросы в два раза быстрее и по качеству ответов выигрывает у предыдущей версии в 70% случаев.

В юбилейном выпуске yet another podcast говорим с командой Яндекс Поиска о том, что за полгода изменилось в мире нейросетей: в Яндексе, Anthropic и OpenAI. Что такое «скрытые рассуждения»? С какими задачами теперь справляются модели? И кто научил YandexGPT решать математические уравнения?

На вопросы отвечают технический директор Поиска Алексей Гусаков, руководитель управления качеством Поиска Катя Серажим и руководитель группы алайнмента YandexGPT Андрей Бут.

🦸‍♂️ В гостях — Wylsacom

yet another podcast — регулярный подкаст о новых технологиях, продуктах Яндекса и людях, которые над ними работают. В каждом выпуске ведущий Павел Кушелев с гостями обсуждают один продукт компании: большое обновление, важную разработку и стоящие за ними процессы.

🎧 НА ДРУГИХ ПЛАТФОРМАХ:

⚡ Содержание выпуска:

00:00 — Что нового в Поиске
01:31 — Кто в лидерах нейрозабега
02:50 — Какие вызовы стоят перед нейросетями
04:34 — Почему у YandexGPT новая цифра
05:57 — Чем измеряется качество ответов
08:06 — Почему нейросети всё ещё плохо переводят
09:52 — «Мы собрали свои бенчмарки»
14:01 — Неочевидная особенность бенчмарков
16:12 — «Первые месяцы двигались почти константно»
18:08 —Котик, динозавр и пантера. Маскоты YandexGPT
19:59 — Что такое мультимодальность в нейросетях
23:12 — Как нейросети представляют себе изображение
25:34 — Что такое функции и агенты
29:32 — Про «скрытые рассуждения» в YandexGPT 4
34:52 — Над какими задачами нейросеть «думает вслух»
35:56 — YandexGPT для бизнеса
39:02 — В каком классе бы училась YandexGPT?
40:24 — Что изменилось в Нейро за полгода
42:23 — Кто, по версии Нейро, забил больше: Аршавин или Марадона
44:16 — Почему у гуся может быть четыре ноги
47:45 — «Мы хотим наэкономить ещё больше калорий»
51:45 — Нейро шагает в сторону VLM
53:01 — Как у Нейро с решением математических задач
55:05 — Кто учил Нейро решать задачи
56:32 — «Ошибка стоит дорого»
01:02:40 — Что ждёт нейросети в будущем
Рекомендации по теме
Комментарии
Автор

Недавно задал вопрос в приложении Алисы (подписка Про): откуда 51 регион? На что она мне выдала просто кучу ссылок на сайты. Перефразировал вопрос, но она так же мне выдала кучу ссылок. Задал этот же вопрос Chat GPT, на что он мне сразу выдал верный ответ: «Регион 51 — это код Мурманской области
России. Этот номер используется на автомобильных номерах, чтобы указать регион регистрации транспортного
средства».

И так не только с данным кейсом а с многими. И возникает вопрос, зачем мне платить пусть и смешные 100 рублей за помощника, который не может ответить на простые вопросы?

luticdesign
Автор

Практически не замечаю нейро. Раньше он был в браузере и на главной поиска. Им можно было пользоваться, что-то уточнять по теме. Сейчас нигде нет, только с некоторой вероятностью появляется в выдаче поиска, но чаще нет, чем да. Видимо такие поисковые запросы. Перестал существовать как продукт
При этом если написать в поиск "Куда делся Нейро" то ответа нет как от обычной выдачи так и от самого Нейро

Александр-жэш
Автор

На словах всё больше и больше интеллекта становится у Алисы. По факту она только тупеет! Последнее время (пол года/год) стало не выносимо пользоваться сервисами видеоконтента. Я не говорю про Ютюб. Почему в Яндекс нет российских фильмов. Пример: "покажи фильмы Павла Лунгина", ответ " Что-то пошло не так". "Покажи фильм Счастливые дни" - Что-то пошло не так. Покажи сериал Гусар - отсылка на Ютуб (естественно он не грузится). Интеграции с Rutyb - НЕТ, с ВКвидео - НЕТ. На 50% запросов молча включается экран - Что то пошло не так, выключить его не возможно, только жёсткий ребут станции, раньше такого вообще не было, Алиса умела выкручиваться и предлагать альтернативные варианты или переспрашивала галантно. О каких высоких технологиях вы сейчас говорите!? Срочно всё исправляйте или потеряете аудиторию.
Активный пользователь и юзеракцепттестер Яндекс.Алисы - Евгений.

opdemaks
Автор

Хотелось бы услышать от разработчиков ответ на такой вопрос: почему они не тестируют свою модель в открытых (публичных) бенчмарках? Например, в открытом российском бенчмарке MERA ребята из МТС, Т-банка и Сбера тестируют свои LLM-модели. Почему YandexGPT не участвует в этом тестировании? 🧐🤔🤔

Dvt__Vnyn
Автор

А насколько адаптируете свои модели по языки СНГ? Какая доля языков СНг в претреин и файнтюн датасетах?
Меня интересует именно узбекский язык.

Также интересно развиваете ли направленое on-premise? Это когда большие компании по соображениям безопасности хотят размещать модели у себя.

turoniy
Автор

Диего Марадона и Андрей Аршавин — выдающиеся футболисты, каждый из которых оставил значительный след в истории футбола. Сравнивая их результативность, можно отметить, что Марадона забил больше голов за свою карьеру.

Диего Марадона:

Клубная карьера: выступал за такие клубы, как «Архентинос Хуниорс», «Бока Хуниорс», «Барселона», «Наполи», «Севилья» и «Ньюэллс Олд Бойз». Общая статистика голов в клубах:

«Архентинос Хуниорс»: 166 матчей, 116 голов.
«Бока Хуниорс»: 40 матчей, 28 голов.
«Барселона»: 58 матчей, 38 голов.
«Наполи»: 258 матчей, 115 голов.
«Севилья»: 29 матчей, 7 голов.
«Ньюэллс Олд Бойз»: 5 матчей, 0 голов.
«Бока Хуниорс» (возвращение): 30 матчей, 7 голов.
Итого: 586 матчей, 311 голов.
Сборная Аргентины: 91 матч, 34 гола.

Андрей Аршавин:

Клубная карьера: выступал за «Зенит», «Арсенал», «Кубань» и «Кайрат». Общая статистика голов в клубах:

«Зенит»: 376 матчей, 80 голов.
«Арсенал»: 144 матча, 31 гол.
«Кубань»: 9 матчей, 0 голов.
«Кайрат»: 108 матчей, 30 голов.
Итого: 637 матчей, 141 гол.
Сборная России: 75 матчей, 17 голов.

Таким образом, Диего Марадона забил больше голов за свою карьеру, чем Андрей Аршавин.

mracobes
Автор

Знаю что вопрос не по теме, но, планируется ли в ближайшее время выпуск клиента Яндекс Музыкы под Linux?

Lunar-dl
Автор

Если задать вопрос нейро: кто забил больше голов марадона или аршавин ?
"Андрей Аршавин забил больше голов, чем Диего Марадона.
Например, в 2009 году в матче против «Ливерпуля» Аршавин забил 4 гола."

Perplexity
"Сделал анализ и ответил:
На основании этих данных, Марадона забил значительно больше голов, чем Аршавин. Его общий показатель составляет 391 гол против примерно 167 голов у Аршавина."

SergeiBogdanov-yf
Автор

Яндекс молодцы 👍 Продолжайте в том же духе. Добавьте пожалуйста возможность копировать текст ответа по буквам, а не целым текстом в приложении "Алиса" на смартфонах

vlabangog
Автор

Здравствуйте! А когда YandexGPT научится писать код? Интересует С++ и подобные ему языки? Почему до сих пор не внедряете? Это в целом безобидно и не рисково (как к примеру та же медицина). Спасибо.

ВикторКудрявцев-юы
Автор

Когда обнова появится ? Просто пока только 3 версия на про

MaximExuzyan
Автор

жду дебаты по теме от чатгпт между я гпт и гигачатом

cramoes
Автор

Почитал комментарии к видео и полностью соглашусь с каждым постом, где пишут что Алиса только глупее стала.
На большинство вопросов она не дает ответ, просто либо ссылку отправляет, либо говорит что-то пошло не так.
Вообще пока не чувствую.
Возможно до меня не докатились обновы. Но переведите меня тогда на тестовый блок

КузнецовВладислав
Автор

Я постоянно использую нейро, чтобы быстро получать ответы на вопросы. И я очень рад, что её добавили в умную камеру! Это потрясающая функция.
Надеюсь, в скором времени мы сможем уточнять вопросы, отправляя файлы, ссылки, фото и так далее

MOII_YouTube
Автор

А я с мамой купили яндекс тв станцию бейсик на 65 дюймов:-)

flarex_
Автор

Поиск с Нейро — действительно топ и геймченджер

playinlifecom
Автор

не понятно блин 1)как оплатить api если ты в украине 2) или хотя бы бесплатно попробовать 4. чо она, реально без цензуры в медицине? -great leap.- аа попробовал, не. не хочет по диагностике ничего говорить (я только о диагностике спрашивал).

alshayda