Сегодня 18 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → водяные знаки

ИИ-модель Google Gemini 2.0 Flash оказалась на удивление хороша в удалении водяных знаков с изображений

Некоторые новейшие «экспериментальные» функции модели Gemini 2.0 Flash от Google вызывают нешуточные опасения у многих пользователей. В частности, модель показала «очень качественные» результаты при удалении водяных знаков с изображений.

 Источник изображений: Google

Источник изображений: Google

Gemini 2.0 Flash умеет не только генерировать изображения по текстовому запросу, но и редактировать их в соответствии с указаниями пользователя — примеры опубликованы на Reddit. На днях обнаружилось, что модель с высокой точностью может удалять водяные знаки. Это поведение радикально отличается от модели GPT-4o от OpenAI, которая запросы на удаление водяных знаков отклоняет.

Ранее уже существовали такие инструменты, как Watermark Remover.io, который умеет удалять водяные знаки со стоковых фотографий, а исследовательская группа Google создала в 2017 году подобный алгоритм, чтобы подчеркнуть необходимость более надёжной защиты авторских прав на изображения.

Gemini 2.0 Flash, похоже, лучше всех проявила себя при удалении сложных водяных знаков, такие как штампы Getty Images, и смогла качественно восстановить изображение. Конечно, после удаления водяного знака модель добавляет метку SynthID, фактически заменяя знак авторского права на «отредактировано с помощью ИИ». Но метки ИИ довольно легко удаляются при помощи другого ИИ, что ранее было продемонстрировано инструментом стирания объектов от Samsung.

По сообщениям пользователей, облегчённая Gemini 2.0 Flash также умеет добавлять узнаваемые изображения реальных людей на фотографии, чего не позволяет полная модель Gemini.

На данный момент описанные возможности доступны только разработчикам через AI Studio — общедоступный бот Gemini отказывается убирать защитные знаки, как показано на скриншоте выше. Google не ответила на запросы о наличии защиты от возможных злоупотреблений после выхода модели в открытый доступ.

Google начнёт помечать фотографии пользователей, в которые «вмешался» ИИ

Приложение «Google Фото» начнёт использовать цифровые водяные знаки SynthID для фотографий, отредактированных с помощью генеративного искусственного интеллекта (ИИ). По заявлению Google, новая функция предназначена для облегчения идентификации изображений, которые были изменены с помощью инструмента Reimagine в Magic Editor.

 Источник изображений: Google

Источник изображений: Google

Magic Editor позволяет легко редактировать фотографии через текстовые запросы, добавляя или удаляя различные детали. Хотя сами по себе ИИ-инструменты не представляют угрозы, Magic Editor может создавать неправомерные компиляции, например разбившиеся вертолёты, сцены аварий, причём без явных меток, указывающих на то, что изображение было изменено.

Водяные знаки призваны решить эту проблему. Однако SynthID визуально не изменяет изображение и чтобы понять, что оно было отредактировано ИИ, придётся дополнительно использовать функцию проверки «Об изображении». Более того, Google признаёт, что некоторые небольшие изменения, выполненные через Magic Editor, могут быть настолько незначительными, что SynthID не сможет идентифицировать эти изменения и применить маркировку.

Эксперты отмечают, что хотя водяные знаки могут помочь в идентификации компиляций, этой технологии недостаточно для масштабной проверки контента, созданного нейросетями. Для надёжности потребуется использовать целый комплекс подходов и программных средств.

Отметим, что система водяных знаков используется в нейросети Google Imagen AI, которая генерирует изображения на основе текста. Аналогичные инструменты были разработаны и другими компаниями, например, функция Content Credentials компании Adobe защищает от несанкционированного доступа к метаданным и позволяет авторам добавлять информацию о себе.

Технология SynthID была разработана командой DeepMind и представляет собой цифровой метатег, встроенный в изображения, видео, аудио или текст. Этот тег позволяет идентифицировать, были ли файлы созданы или изменены с помощью ИИ.

OpenAI научилась распознавать сгенерированные своим ИИ изображения, но не без ошибок

OpenAI объявила о начале разработки новых методов определения контента, созданного искусственным интеллектом (ИИ). Среди них — новый классификатор изображений, который определяет, было ли изображение сгенерировано ИИ, а также устойчивый к взлому водяной знак, способный маркировать аудиоконтент незаметными сигналами.

 Источник изображения: Placidplace / Pixabay

Источник изображения: Placidplace / Pixabay

Новый классификатор изображений способен с точностью до 98 % определять, было ли изображение создано ИИ-генератором изображений DALL-E 3. Компания утверждает, что их классификатор работает, даже если изображение было обрезано, сжато или была изменена его насыщенность. В то же время эффективность этой разработки OpenAI в распознавании контента, созданного другими ИИ-моделями, такими как Midjourney, значительно ниже — от 5 до 10 %.

Также OpenAI ввела водяные знаки для аудиоконтента, созданного с помощью своей платформы преобразования текста в речь Voice Engine, находящейся на стадии предварительного тестирования. Эти водяные знаки содержат информацию о создателе и методах создания контента, что значительно упрощает процесс проверки их подлинности.

OpenAI активно участвует в работе Коалиции по происхождению и аутентичности контента (C2PA), в состав которой также входят такие компании, как Microsoft и Adobe. В этом месяце компания присоединилась к руководящему комитету C2PA, подчеркивая свою роль в разработке стандартов прозрачности и подлинности цифрового контента.

Для этих целей OpenAI интегрировала в метаданные изображений так называемые учётные данные контента от C2PA. Эти учётные данные, фактически являясь водяными знаками, включают информацию о владельце изображения и способах его создания. OpenAI уже много лет работает над обнаружением ИИ-контента, однако в 2023 году компании пришлось прекратить работу программы, определяющей текст, сгенерированный ИИ, из-за её низкой точности.

Разработка классификатора изображений и водяного знака для аудиоконтента продолжается. В OpenAI подчёркивают, что для оценки эффективности этих инструментов крайне важно получить отзывы пользователей. Исследователи и представители некоммерческих журналистских организаций имеют возможность протестировать классификатор изображений на платформе доступа к исследованиям OpenAI.


window-new
Soft
Hard
Тренды 🔥
Вышел бесплатный графический редактор GIMP 3.0 — первое крупное обновление за семь лет 30 мин.
«Что случилось с ARK 2?»: анонс дополнения к ARK: Survival Ascended вызвал вопросы о ходе разработки второй части 2 ч.
Состоялся релиз RuBackup OneClick — решения для защиты IT-инфраструктур малого и среднего бизнеса 4 ч.
Сборщики данных для ИИ оказались виновниками массового замедления сайтов по всему интернету 4 ч.
Новая демоверсия амбициозного симулятора жизни Inzoi выйдет 20 марта, но не для всех 5 ч.
250-килограммовый логотип-птичку Twitter со штаб-квартиры соцсети выставили на аукцион 5 ч.
Минторг США запретил сотрудникам использовать DeepSeek на рабочих устройствах 5 ч.
Веб-поиск на основе ИИ убил классические «десять синих ссылок» Google 6 ч.
Создатели пошаговой ролевой игры Shadow of the Road анонсировали открытую «альфу» — тестирование пройдёт в Steam, причём уже очень скоро 7 ч.
Матрица импортозамещения от СТРИМ Консалтинг: «Базис» — лидер рынка виртуализации 7 ч.
SoftBank купит за $676 млн бывший японский завод Sharp для строительства ИИ ЦОД, возможно — в интересах OpenAI 13 мин.
Samsung наконец научилась выпускать память HBM3E, пригодную для ИИ-чипов Nvidia — сертификация завершится к лету 2 ч.
Учёные США научились производить ядерное топливо для модульных АЭС на расплавах солей, но это не точно 3 ч.
Xiaomi выпустила 200 000-й электромобиль — это заняло меньше года 4 ч.
Первый складной iPhone может оказаться вдвое дороже iPhone 16 Pro Max 5 ч.
Apple iPhone 16e показал стойкость в суровых испытаниях на прочность 6 ч.
В Китае выпустили полтора миллиона сервисных роботов за два месяца — в 15 раз больше, чем промышленных 6 ч.
Абсолютный успех: научный зонд Blue Ghost навсегда заснул на Луне после продуктивной двухнедельной работы 7 ч.
Китай ограничит доступ США и других стран к технологиям производства литиевых батарей и компонентов для них 7 ч.
Микроконтроллер Raspberry Pi RP2350 поступил в продажу по цене от $0,8 7 ч.