16+
Суббота, 15 июня 2024
  • BRENT $ 82.67 / ₽ 7359
  • RTS1137.45

Цитаты персоны

Все персоны
Роман Душкин

Роман Душкин

главный архитектор систем искусственного интеллекта исследовательского центра ИИ по направлению «Транспорт и логистика» НИЯУ МИФИ

Высказанные мнения:

сортировать   по рейтингу / по датерейтинг / дата
Мнение к материалу от 22 мая 2024 года:
«Фабрики — роботам»
«Интеллектуальные транспортные системы это то, что внедряется у нас повсеместно, по всей территории страны, и в них как раз используется большое количество методов искусственного интеллекта, в том числе адаптивное управление транспортными потоками, интеллектуализация управления дорожным движением, когда у нас берется транспортная модель, делается прогноз о том, что будет, потом прогноз сравнивается с фактом того, что произошло, на основании этого рекалибруется сама транспортная модель и перенастраиваются методы управления дорожным движением. И вот эта адаптивность системы управления дорожным движением как раз и показывает ту самую интеллектуальность. Это все уже внедрено на улицах городов. Например, если брать область безопасности, всякое видеонаблюдение, распознавание инцидентов на дорогах и не только на дорогах, это тоже все российские решения, интеллектуальная видеоаналитика, это все внедряется повсеместно. И многие российские компании, как раз делают решения в области интеллектуальной видеоаналитики, которые находятся и занимают первые места в мировых рейтингах, так что все идет, все постепенно движется».
Мнение к материалу от 19 мая 2024 года:
«Нейросеть «Яндекса» неохотно отвечает на острополитические вопросы»
«Большинство моделей будут неохотно разговаривать на острые политические темы. Да, если мы будем брать, допустим, ситуацию с Украиной, любая модель будет пытаться этот вопрос обойти так или иначе. Но плох тот нейромант, который не заставит модель сказать то, что ему хочется. При помощи тех или иных заклинаний можно, в общем-то, модель заставить сказать все, что угодно. А потом вне контекста, не показывая, какими были запросы, выдать любой ответ за то, что она вроде как так говорит. Если мы хотим исследовать какую-то модель искусственного интеллекта на непредвзятость, необходимо все-таки использовать научный подход, и здесь нужно разрабатывать методологию, проводить сравнительный анализ, причем в объективно одинаковых условиях, как те или иные модели реагируют на одинаковые вопросы в одинаковом же контексте. И только на основании такого глубокого исследования можно делать какие-то выводы».
Мнение к материалу от 16 мая 2024 года:
«Microsoft обратилась к сотрудникам в Китае с просьбой рассмотреть переезд»
«Это элемент мягкой силы даже не Microsoft, а гегемона США, который себе мыслит не пойми что. Естественно, они хотят ослаблять своих противников, назовем это так, а Китай и США на глобальной мировой доске в области науки, технологий и особенно искусственного интеллекта — это два самых мощных игрока, и они соперничают друг с другом. Они делят первое-второе место, поделить не могут, и я уверен, что это именно в первую очередь попытки ослабить Китай, как нас ослабляли в 90-е, когда была «утечка мозгов». Это то же самое, Microsoft хочет, чтобы перспективные молодые люди или даже немолодые ученые покидали Китай и не могли использовать свои мозги для защиты национальных интересов Китая или осуществления технического прогресса в Китае».
Мнение к материалу от 14 мая 2024 года:
«OpenAI представила GPT-4o, распознающую голос и видео»
«OpenAI обучили новую модель GPT воспринимать как минимум данные четырех новых модальностей, трех или четырех, в зависимости от того, как считать. Значит, если ChatGPT или GPT-3.5 принимает данные одной модальности, то есть текст, который мы пишем, GPT-4 воспринимает данные двух модальностей — это текст и картинки, которые мы можем кидать в чат, то GPT-4o уже добавляет две новые модальности данных — это аудио и видео. То есть мы можем с ней голосом общаться, при этом она воспринимает интонацию, невербальные признаки разговора, которые мы воспринимаем интуитивно. Также она теперь может воспринимать видео, то есть можно прямо поток видеокамеры ей пускать, и она в режиме реального времени или очень близком обрабатывает этот поток и может или комментировать, или как-то реагировать. То есть это гиперавтоматизация каких-то рутинных процессов, связанных с когнитивной обработкой информации. Например, первое, что приходит в голову, — это видео, например комментирование каких-то спортивных матчей, то есть она же может на лету описывать то, что происходит. Это же можно применить, например, для системы охранного видеонаблюдения, для того чтобы смотреть, что происходит в створе видеокамеры, не происходит ли каких-то инцидентов».
Мнение к материалу от 14 мая 2024 года:
«OpenAI презентовала нейросеть GPT-4o, которая быстро анализирует информацию»
«OpenAI обучили новую модель GPT воспринимать как минимум данные четырех новых модальностей, трех или четырех, в зависимости от того, как считать. Значит, если GPT-4 классическая или GPT-3.5 принимает данные одной модальности, то есть текст, который мы пишем, GPT-4 классическая воспринимает данные двух модальностей — это текст и картинки, которые мы можем кидать в чат, то GPT-4o уже добавляет две новые модальности данных — это звуки, аудио, то есть мы можем с ней голосом общаться, при этом она воспринимает интонацию, невербальные признаки разговора, которые мы воспринимаем интуитивно. Также она теперь может воспринимать видео, то есть можно прямо поток видеокамеры ей пускать, и она в режиме реального времени или очень близком обрабатывает этот поток и может или комментировать, или как-то реагировать. Использовать это можно там же, где и GPT-4, как минимум, то есть это гиперавтоматизация каких-то рутинных процессов, связанных с когнитивной обработкой информации. Вот эта система получает данные и обрабатывает данные в двух новых модальностях, то есть видео и звук, она может использоваться в том числе и для решения новых задач. Например, первое, что приходит в голову, это видео, например, комментирование каких-то спортивных матчей, то есть она же может на лету описывать то, что происходит. Это же можно применить, например, для системы охранного видеонаблюдения, для того чтобы смотреть, что происходит в створе видеокамеры, не происходит ли каких-то инцидентов».

загрузить еще...

Фотоистории
BFM.ru на вашем мобильном
Посмотреть инструкцию