Сегодня 26 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → рейтинг

Популярные модели ИИ провалили тест на прозрачность: их разработчики скрыли всё, что смогли

Стремясь приоткрыть завесу над нейросетями, работающими по принципу «чёрного ящика», Стэнфордский университет в сотрудничестве с Массачусетским технологическим институтом и Принстоном разработал оценочный «Индекс прозрачности базовой модели» (Foundational Model Transparency Index, FMTI). Новая система оценки ранжирует 10 крупнейших моделей ИИ на основе общедоступных сведений о них. Результаты удручающие, лишь модели с открытым исходным кодом дарят некоторую надежду.

 Источник изображения: Pixabay

Источник изображения: Pixabay

«В то время как социальное влияние моделей ИИ растёт, их прозрачность снижается, отражая секретность, которая сопровождала предыдущие цифровые технологии, такие как социальные сети», — утверждает соавтор исследования Саяш Капур (Sayash Kapoor). А низкая прозрачность, по мнению учёных, затрудняет «потребителям понимание ограничений модели или возмещение причинённого вреда».

FMTI оценивает 10 крупнейших моделей ИИ по 100 различным критериям, связанным с прозрачностью и открытостью. Сюда входит, например, их структура, информация, на которой они обучались, и потребность в вычислительных ресурсах. Также учитываются политики использования модели, защиты данных и снижения рисков. Полный список показателей и методологии можно найти в сопроводительном 110-страничном документе к исследованию.

 Источник изображений: Stanford University, The Center for Research on Foundation Models

Источник изображений: Stanford University, The Center for Research on Foundation Models

Перед публикацией отчёта исследователи обсуждали результаты теста совместно с руководителями каждой компании, давая им возможность аргументированно «оспаривать оценки, с которыми они не согласны». Если команда находила аргументы создателей ИИ убедительными, производилась корректировка оценок. Даже с учётом столь взвешенного подхода средняя оценка по всем моделям составила всего 37 баллов из 100 (37 %). На основании этого результата исследователи пришли к выводу, что ни одна из моделей на сегодняшний день не обеспечивает адекватной прозрачности.

Модель Llama 2 от Meta заняла первое место с результатом 54 %. Bloomz от Hugging Face, заняла второе место с 53 %, за ней следует GPT-4 от OpenAI, получившая 48 %. «OpenAI, в названии которой есть слово “открытый”, чётко показала отсутствие прозрачности в отношении большинства аспектов своей флагманской модели GPT-4», — прокомментировали этот результат исследователи. Модель Stable Diffusion 2 компании Stability AI заняла четвёртое место с 47 %. Модель PaLM2 от Google, на которой основан чат-бот Bard, замыкает пятёрку лучших, получив 40 %.

«Один из самых острых политических споров в области ИИ сегодня заключается в том, должны ли модели ИИ быть открытыми или закрытыми», — говорят исследователи. Открытые модели в целом получили более высокий рейтинг, чем закрытые. Модель считается «открытой», если её код размещается публично как открытое программное обеспечение. К открытым моделям относятся такие модели ИИ как Llama 2 и Bloomz, к закрытым — GPT-4. Стэнфордский университет продемонстрировал преимущества открытых моделей, создав свою собственную модель ИИ Alpaca на основе открытого программного кода Llama от Meta.

Исследователи надеются, что FMTI окажет позитивное влияние на политику создателей ИИ, и в дальнейшем планирует публиковать рейтинг FTMI ежегодно. Девять из десяти участников рейтинга ранее уже присоединились к инициативам правительства США по ответственному использованию ИИ. FMTI может стать дополнительным мотивирующим фактором для выполнения ими своих обязательств.

Данные рейтинга FMTI также могут пригодиться Европейскому Союзу при разработке следующей редакции «Закона об искусственном интеллекте». Исследователи полагают, что использование нового индекса даст законодателям большую ясность в отношении положения дел в области ИИ и того, что они потенциально могут изменить с помощью регулирования.

Дженсен Хуанг оказался самым популярным гендиректором в США — его одобряют 96 % сотрудников

В августе 2023 года профессиональная социальная сеть Blind провела опрос и определила рейтинг одобрения 103 генеральных директоров крупных компаний. В опросе приняли участие 13 171 работников этих компаний из США. На вершине рейтинга оказался глава NVIDIA Дженсен Хуанг (Jensen Huang), действия которого одобряют 96 % респондентов.

 Источник изображения: Intel

Источник изображения: Intel

Популярность Дженсена Хуанга неудивительна, ведь он является весьма харизматичным человеком, а его компания NVIDIA является очень популярной и успешной. В этом году она захватила по разным оценкам до 95 % рынка серверов ИИ, а цена её акций утроилась с начала 2023 года, и теперь капитализация NVIDIA составляет $1,16 трлн. Летом прошлого года, когда NVIDIA не оправдала ожиданий по прибыли, а экономика была в стагнации, Хуанг заверил сотрудников, что в компании произойдут повышения, а не увольнения. «Он предвидел приближение этой лихорадки искусственного интеллекта более 10 лет назад, — отозвался о Хуанге участник опроса Blind. — Я полностью ему доверяю». Кроме того, Дженсен просто неотразим в своей традиционной кожаной куртке.

Тим Кук (Tim Cook) из Apple занимает четвёртое место с рейтингом одобрения 83 %. С 2011 года Кук руководил ростом Apple и превратил её в крупнейшую компанию в мире по рыночной капитализации — сейчас она составляет $2,81 трлн. Сообщается, что сотрудники Apple преданы Куку, несмотря на то, что Apple призывает их посещать офис как минимум три дня в неделю, что вызывает негативную реакцию после почти двух лет удалённой работы. Добровольное сокращение зарплаты генерального директора на 40 % в этом году видимо дополнительно повысило рейтинг Кука.

За Хуангом на втором месте следует Дуг Макмиллон (Doug McMillon) из Walmart с рейтингом 88 %, а почётное третье место с 84 % занял Никеш Арора (Nikesh Arora) из Palo Alto Networks. Замыкает пятёрку лидеров Али Годси (Ali Ghodsi), генеральный директор компании Databricks, занимающейся данными и искусственным интеллектом с рейтингом одобрения 83 %. Лиза Су (Lisa Su) из AMD также оказалась довольно высоко в списке, заняв восьмое место с рейтингом одобрения 79 %.

 Источник изображений: Blind

Источник изображений: Blind

В самом низу списка оказались компании, сократившие в этом году большое количество персонала. Линда Яккарино (Linda Yaccarino), недавно назначенная генеральным директором X, получила рейтинг одобрения 4 %, немного опередив Эвана Шпигеля (Evan Spiegel) из Snap, рейтинг которого равен 3 %. Джон Ричителло (John Riccitiello), на днях покинувший пост главы Unity из-за скандала с новой политикой оплаты за игровой движок, удовольствовался 2 % одобрения.

Самым низким рейтингом в размере 0 % могут «похвастаться» два генеральных директора: Дэвид Геккелер (David Goeckeler) из Western Digital и Эрик Нордстром (Erik Nordstrom) из Nordstrom. В июне Western Digital уволила более 200 сотрудников, Nordstrom также проводит массовые сокращения.

В целом рейтинг руководителей не впечатляет: средний показатель одобрения составляет всего 32 %. Самыми популярными стали боссы в сферах электронной коммерции, финансовых услуг и индустрии высоких технологий. Судя по результатам опроса, гарантия занятости оказывает заметное влияние на то, насколько сотрудник одобряет своего начальника. В десятку лучших смог попасть только один генеральный директор, уволивший сотрудников за последние годы. Им стал глава Autodesk, сократившей в феврале 2 % мирового персонала, при этом продолжая нанимать сотрудников в течение года.

OnePlus Ace 2 Pro возглавил рейтинг самых мощных Android-смартфонов по версии Antutu

В августе этого года на рынок вышли несколько производительных смартфонов на базе Android, включая OnePlus Ace 2 Pro, Redmi K60 Ultra и Realme GT5. Новый флагман OnePlus по итогам месяца сумел добиться больших успехов и возглавил рейтинг производительности Android-смартфонов по версии мобильного бенчмарка Antutu.

 OnePlus Ace 2 Pro / Источник изрображения: OnePlus

OnePlus Ace 2 Pro / Источник изрображения: OnePlus

OnePlus Ace 2 Pro имеет в оснащении производительный микропроцессор Qualcomm Snapdragon 8 Gen 2, который в максимальной комплектации дополняется 24 Гбайт оперативной памяти LPDDR5X и накопителем на 1 Тбайт. Средний результат аппарата в бенчмарке Antutu составил 1 648 735 баллов, что позволило ему обойти лидера прошлого месяца RedMagic 8S Pro.

 Источник изображения: Antutu

Источник изображения: Antutu

На второй позиции с результатом 1 645 393 балла расположился смартфон iQOO 11S. Он построен на базе процессора Qualcomm Snapdragon 8 Gen 2 в сочетании с 16 Гбайт оперативной памяти и накопителем формата UFS 4.0 ёмкостью до 1 Тбайт. Замыкает тройку лидеров RedMagic 8S Pro+, который набрал в бенчмарке 1 637 536 баллов. Все три лидера имеют в оснащении процессор Snapdragon 8 Gen 2, что доказывает превосходство чипа над конкурентами, включая MediaTek Dimensity 9200.

 Источник изображения: Antutu

Источник изображения: Antutu

В категории субфлагманов лидерство, как и месяц назад, остаётся за Redmi Note 12 Turbo, который в среднем набирает 1 148 376 баллов. На втором месте идёт Realme GT Neo5 SE с результатом 1 146 607 баллов. Оба смартфона построены на базе процессора Snapdragon 7+ Gen 2. В тройку также вошёл iQOO Neo 7 SE, имеющий в оснащении чип MediaTek Dimensity 8200 и набравший 949 742 балла.

Можно сказать, что в августе наблюдалась динамичная борьба за первенство в плане производительности Android-смартфонов. По итогам месяца победить в этом соперничестве удалось OnePlus Ace 2 Pro, который по праву возглавил рейтинг самых мощных смартфонов на базе Android.

«МегаФон» сохранил лидерство в России по покрытию сети и скорости мобильного интернета

В 2023 году оператор «МегаФон» сохранил лидирующую позицию в России по покрытию сотовой сети и скорости мобильного интернета, пишет «Коммерсант» со ссылкой на данные независимого исследования международной компании Ookla, знаменитой своим сервисом Speedtest.

 Источник изображений: speedtest.net

Источник изображений: speedtest.net

Для составления рейтинга Ookla использовала данные 5 млн замеров скорости подключения с 1 млн различных устройств, сделанных абонентами операторов с помощью приложения Speedtest в течение первого полугодия 2023 года. Это позволило оценить скорость мобильного интернета в любой локации на всей территории России.

Медианная скорость скачивания в сети «МегаФона» составила 29,34 Мбит/с, а скорость загрузки данных — 9,71 Мбит/с. У занявшего вторую позицию рейтинга оператора сотовой связи «билайн» эти показатели равны 24,49 и 9,50 Мбит/с соответственно. На третьем месте — МТС (23,38 и 7,96 Мбит/с). Четвёртое место занял Tele2 с медианной скоростью скачивания 20,40 Мбит/с и скоростью загрузки данных 6,80 Мбит/с. Следует отметить, что «МегаФон» уже седьмой год бессменный лидер по скорости мобильного интернета.

Как сообщили в «МегаФоне», оператор не только расширяет покрытие, в том числе в регионах, в небольших населённых пунктах, но и повышает эффективность существующей инфраструктуры. Только за счёт программы рефарминга — перевода частот, задействованных в сетях связи 2G и 3G, в современный стандарт LTE — оператор смог повысить скорость в 24 регионах на треть. По словам Алексея Титова, технического директора «МегаФона», оператор с начала года увеличил пропускную способность в каналах связи с сервисами VK и Telegram более чем на 40 %, оперативно реагируя на увеличение у них трафика.

В рейтинге операторов по покрытию сети «МегаФон» тоже занял первое место, набрав 657 баллов. У находящегося на втором месте МТС — 558 баллов. На третьем месте — Tele2 с 507 баллами, четвёртое место у «билайна» с 422 баллами.

Смартфон на чипе MediaTek Dimensity 9200+ стал самым мощным в июне по версии AnTuTu

На сайте мобильного бенчмарка AnTuTu опубликован список самых производительных смартфонов по итогам июня 2023 года. Разработчик отметил, что в прошлом месяце состоялся релиз AnTuTu v10, и сравнивать новые результаты с показателями предыдущей версии приложения нельзя. Лидерами свежего рейтинга оказались смартфоны компании vivo и принадлежащего ей бренда iQOO на платформах MediaTek Dimensity 9200+ и Qualcomm Snapdragon 8 Gen 2.

 Источник изображений: antutu.com

Источник изображений: antutu.com

Первое место в рейтинге с результатом 1 619 144 балла занял июньский дебютант vivo X90s, работающий на базе MediaTek Dimensity 9200+. Результат отчасти предсказуем, если учесть особые взаимоотношения производителя смартфонов и разработчика процессоров. Не исключено, что новый чип Dimensity 9300 впервые появится на рынке телефоне от vivo — модель, вероятно, получит название X100, впервые с трёхзначным индексом.

Второе и третье места заняли соответственно iQOO 11 Pro (1 601 066 баллов) и iQOO 11 (1 599 322 балла) — оба работают на платформе Qualcomm Snapdragon 8 Gen 2. Накануне был анонсирован улучшенный флагман линейки iQOO 11S, получивший тот же процессор, но более мощную 200-Вт зарядку, независимый чип управления дисплеем и 1 Тбайт на встроенном накопителе.

В субфлагманском зачёте никакого разброда нет — все устройства почти строго выстроились по модели процессора. Лидерами оказались Redmi Note 12 Turbo (1 151 420 баллов) и realme GT Neo 5 SE (1 136 824 балла) на процессоре Qualcomm Snapdragon 7+ Gen 2. Оба смартфона выпускаются в конфигурации с 16 Гбайт оперативной и 1 Тбайт постоянной памяти. Третье место с 948 270 баллами занял iQOO Neo7 SE, работающий на процессоре MediaTek Dimensity 8200 — как и последующие четыре места, хотя пятое и шестое досталось устройствам на Dimensity 8200 Ultra. Замыкают десятку пара устройств на Dimensity 8100-Max и смартфон realme GT Neo 3 на базовом Dimensity 8100.

Tesla Model Y стала самым продаваемым автомобилем в мире

Впервые полностью электрический автомобиль стал самым продаваемым автомобилем в мире. Tesla Model Y превзошла прежних лидеров Toyota RAV4 и Corolla и заняла первое место в мировом рейтинге продаж в первом квартале 2023 года. Это особенно впечатляет, учитывая, что цена на Model Y 2023 года начинается с $47 490, что значительно выше, чем $21 550 за Corolla и $27 575 за RAV4. Продажи Model Y выросли на 69 % по сравнению с аналогичным периодом прошлого года.

 Источник изображения: SpaceX

Источник изображения: SpaceX

Tesla Model Y продалась в первом квартале этого года в количестве 267 200 экземпляров, поставив мировой рекорд и опередив Corolla с 256 400 единицами и RAV4 с 214 700 автомобилями, проданными за тот же период. Илон Маск (Elon Musk) ранее предсказывал, что Model Y займёт первое место, заявив инвесторам в 2021 году: «Мы думаем, что Model Y станет самым продаваемым автомобилем или транспортным средством любого типа в мире. Вероятно, в следующем году».

Тогда Model Y не достигла этой цели, но заняла третье место в общем глобальном рейтинге за 2022 год, заняв шестое место в списке 10 самых продаваемых автомобилей в Америке, несмотря на жёсткую конкуренцию со стороны пикапов и полноразмерных внедорожников. В прошлом году Model Y также стала самым продаваемым автомобилем в Европе и Калифорнии и заняла четвёртое место по продажам в Китае, поднявшись на 15 позиций по сравнению с предыдущим годом.

Следует отметить, что, хотя Tesla Model Y в настоящее время стала самым продаваемым автомобилем в мире, компания Tesla, безусловно, не является крупнейшим мировым автопроизводителем. Volkswagen, Toyota, General Motors и Ford сообщают о более высоких доходах и объёмах продаж. Tesla даже не входит в десятку крупнейших мировых производителей автомобилей, заняв 19-е место в 2022 году.

Для видеоигр в России предложили создать отдельную систему возрастных рейтингов и доверить маркировку разработчикам

«Ведомости» сообщает, что руководитель направления «Цифровое развитие» Центра стратегических разработок (ЦСР) Александр Малахов предложил оставить возрастную маркировку видеоигр в России разработчикам и издателям.

 Источник изображения: Cyberia Nova

Источник изображения: Cyberia Nova

По мнению Малахова, присваивать игре рейтинг должны те, кто вводит её в оборот, а не сторонняя организация. Учреждение института экспертов, которые будут проверять каждый проект и выдавать ему категорию, предполагает высокие нагрузки.

«Действующее законодательство в сфере защиты детей от [опасной] информации не предполагает обязательную экспертизу всех материалов. Эту маркировку аналогичным образом накладывает автор или издатель», — объяснил Малахов.

 The Sims 4 в России получила рейтинг «18+» (источник изображения: Steam)

The Sims 4 в России получила рейтинг «18+» (источник изображения: Steam)

Малахов считает, что возрастную маркировку стоит вводить по аналогии с прописанной в законе № 436-ФЗ «О защите детей от информации, причиняющей вред их здоровью и развитию», но с поправкой на особенности игр.

Сейчас маркировка видеоигр в России осуществляется в соответствии с этим законом, но он касается только фильмов, сериалов, книг, музыки и иных произведений, которые признаются «информацией» в понимании федерального законодательства.

 Разговоры о необходимости отдельного закона для маркировки видеоигр в России ведутся с 2019 года (источник изображения: Steam)

Разговоры о необходимости отдельного закона для маркировки видеоигр в России ведутся с 2019 года (источник изображения: Steam)

В ЦСР предлагают ввести для видеоигр в России пять основных возрастных категорий («0+», «6+», «12+», «16+», «18+») и семь дополнительных дескрипторов:

  • «проявление жестокости»;
  • «нецензурная брань»;
  • «сцены действий сексуального характера»;
  • «внутриигровые покупки»;
  • «сцены, вызывающие страх»;
  • «запрещённые вещества»;
  • «алкогольная продукция».

Вслед за этим российскую систему нужно синхронизировать с международными (PEGI в Европе, ESRB в США и Канаде, USK в Германии), что позволит взаимно признавать российские и международные категории игр.

 Предложения ЦСР распространяются только на игры в цифровом формате (источник изображения: ОнЛайн Трейд)

Предложения ЦСР распространяются только на игры в цифровом формате (источник изображения: ОнЛайн Трейд)

По словам Малахова, инициатива обсуждалась с представителями Роскомнадзора, Минэкономразвития и Минцифры. В Минэке сообщили, что ведомство рассматривает предложения, подготовленные как ЦСР, так и участниками индустрии.

«На данном этапе мы не отдаём приоритет тому или иному подходу по регулированию, а продолжаем работу по сбору предложений. Позиция министерства будет зафиксирована по итогам проработки предложений», — уточнил представитель Минэкономразвития.

NVIDIA GeForce RTX 4090 дебютировала в статистике Steam, а AMD снова отнимает позиции у Intel

Судя по обновлённой статистике Steam, высокая цена видеокарты NVIDIA GeForce RTX 4090 геймеров не отпугнула — данная новинка ворвалась в статистику используемых пользователями Steam видеокарт, продемонстрировав вторую по величине месячную динамику. А ещё месяц выдался удачным для Windows 11, которая преодолела отметку в 30 % пользователей и продолжила атаку на Windows 10.

В десятке видеокарт по версии Steam за минувший месяц мало что изменилось, хотя стоит отметить мобильную NVIDIA GeForce RTX 3060, которая показала самую активную динамику (0,44 %) и заняла третье место по распространённости на платформе. GeForce RTX 4090 стала первой видеокартой нового поколения в основном разделе — ранее она вместе с другими моделями 40-й серии присутствовала только в секции Vulkan Systems. И её доля в 0,24 % — это более чем достойный показатель для модели с рекомендованной розничной ценой в $1600.

 Видеокарты, сильнее других прибавившие в популярности в Steam

Видеокарты, сильнее других прибавившие в популярности в Steam

Рост в семействе NVIDIA Ampere показали также модели GeForce RTX 3050, RTX 3060 Ti и RTX 3090. В лагере AMD самую активную динамику показала Radeon RX 6700 XT, хотя большинство «красных» видеокарт по-прежнему довольствуется нижней половиной таблицы. Лидерство же сохранила GeForce GTX 1650, в прошлом году ставшая преемником GeForce GTX 1060, возглавившей чарт Steam ещё в 2018 году.

 Самые популярные видеокарты в Steam

Самые популярные видеокарты в Steam

Рейтинг центральных процессоров отметился ростом доли AMD, которая достигла 32,84 % и почти дотянулась до рекордных 33,73 %, которые были прошлым летом. В рейтинге операционных систем грядут перемены: 31 января Microsoft прекратила прямые продажи Windows 10, так что её доля теперь будет снижаться активнее. «Старушка» Windows 7 продолжает цепляться за жизнь с долей 0,11 %.

И коротко о других разделах статистики. Самый распространённый объём оперативной памяти — 16 Гбайт, самое популярное разрешение — 1920 × 1080 пикселей, а самая популярная гарнитура виртуальной реальности — Oculus Quest 2. Всё без изменений.


window-new
Soft
Hard
Тренды 🔥
Отечественная платформа Tantor повысит производительность и удобство работы с СУБД на базе PostgreSQL 3 ч.
В Steam вышла новая демоверсия голливудской стратегии Hollywood Animal от авторов This is the Police 4 ч.
IT-холдинг Т1 подал иск к «Марвел-Дистрибуции» в связи с уходом Fortinet из России 4 ч.
Рождественское чудо: в открытый доступ выложили документы Rockstar начала 2000-х, включая планы на GTA Online от 2001 года 5 ч.
«Битрикс24» представил собственную ИИ-модель BitrixGPT 6 ч.
За 2024 год в Китае допустили к релизу более 1400 игр — это лучший результат за последние пять лет 6 ч.
Google применила конкурирующего ИИ-бота Anthropic Claude для улучшения своих нейросетей Gemini 7 ч.
Apple призналась, почему из российского App Store стали пропадать VPN-приложения 7 ч.
Платформер Restitched отправит исследовать и создавать красочные миры — геймплейный трейлер духовного наследника LittleBigPlanet 8 ч.
Apple объяснила, почему не хочет создавать собственный поисковик на замену Google 8 ч.
Российскую игровую приставку собрались построить на процессоре «Эльбрус», для которого не существует игр 19 мин.
Ubitium придумала универсальный процессор — он один выполняет работу CPU, GPU, FPGA и DSP 40 мин.
Equinix предложил ИИ-фабрики на базе систем Dell с ускорителями NVIDIA 59 мин.
NASA показало «рождественскую ель» галактического масштаба 2 ч.
Китайский оператор ЦОД Yovole может выйти на IPO в США — после неудавшейся попытки в Китае 2 ч.
Patriot представила SSD P400 V4 PCIe 4.0 — до 4 Тбайт и до 6200 Мбайт/с 2 ч.
OnePlus представила доступные флагманы Ace 5 и Ace 5 Pro со Snapdragon, большими экранами и до 16 Гбайт ОЗУ 3 ч.
Китайский робопёс Unitree B2-W показал чудеса ловкости при езде по пересечённой местности и воде 4 ч.
В серию трёхфазных ИБП Ippon Intatum ML вошли модели мощностью до 300 кВА 4 ч.
Китайцы создали SSD на собственной флеш-памяти, который по скорости не уступает лучшим мировым аналогам 4 ч.