itkvariat

    Видеостартап с искусственным интеллектом Runway без разрешения обучался на «тысячах» видеороликов YouTube




    Компания Runway, занимающаяся искусственным интеллектом, без разрешения использовала «тысячи» видеороликов с YouTube и пиратских версий фильмов, защищенных авторским правом. 404 Media получили предполагаемые внутренние таблицы, в которых говорится, что стартап по созданию видео с использованием искусственного интеллекта обучил свою модель Gen-3, используя контент YouTube с таких каналов, как Disney, Netflix, Pixar и популярных СМИ.

    Предполагаемый бывший сотрудник Runway рассказал, что компания использовала электронную таблицу, чтобы пометить списки видео, которые она хотела добавить в свою базу данных. Затем он загружал их с помощью прокси-программы с открытым исходным кодом, чтобы замести следы. На одном листе перечислены простые ключевые слова, такие как "космонавт", "фея" и "радуга", со сносками, указывающими, нашла ли компания соответствующие высококачественные видеоролики для обучения. Например, термин «супергерой» включает в себя примечание «Множество видеороликов».

    Другие заметки показывают, что Runway отметил каналы YouTube с Unreal Engine, режиссером Джошем Нойманом и фан-страницей Call of Duty как хорошие источники обучающих видеороликов с «высоким движением».

    «Каналы в этой таблице были попыткой всей компании найти видео хорошего качества для построения модели», — рассказал бывший сотрудник 404 Media. «Затем это было использовано в качестве входных данных для массового веб-сканера, который загружал все видео со всех этих каналов, используя прокси, чтобы избежать блокировки Google».

    В списке из почти 4000 каналов YouTube, собранном в одной из электронных таблиц, такие каналы как CBS New York, AMC Theaters, Pixar, Disney Plus, Disney CD и аквариумом Монтерей-Бэй, отмечены как "рекомендуемые".

    Кроме того, сообщается, что Runway составил отдельный список видео с пиратских сайтов. Таблица под названием «Источник, не связанный с YouTube» включает 14 ссылок на такие источники, как неавторизованный онлайн-архив фильмов Studio Ghibli, сайты с аниме и пиратскими фильмами, фан-сайт, на котором представлены видеоролики из игр Xbox, и сайт потоковой передачи анимаций Kisscartoon.sh.

    В качестве убедительного подтверждения того, что компания использовала такие данные для обучения, 404 Media обнаружила, что запрос видеогенератору имен популярных YouTube-блогеров, перечисленных в электронной таблице, выдал результаты, имеющие сверхъестественное сходство. Важно отметить, что ввод одних и тех же имен в более старую модель Gen-2 от Runway, обученную до предполагаемых данных в электронных таблицах, привел к «несвязанным» результатам, например, к типичным мужчинам в костюмах. Кроме того, после того, как издание связалось с Runway и спросило о сходстве ютуберов в результатах, инструмент искусственного интеллекта вообще перестал их генерировать.

    «Я надеюсь, что, поделившись этой информацией, люди лучше поймут масштаб этих компаний и то, что они делают, чтобы создавать «крутые» видеоролики», — сказал бывший сотрудник 404 Media.

    По крайней мере, некоторые компании, занимающиеся искусственным интеллектом, стремятся нормализовать свои инструменты и занять лидирующие позиции на рынке, прежде чем пользователи – и суды – поймут, как именно они это делали. Обучение с разрешения посредством лицензионных сделок — это одно, и это еще одна тактика, которую недавно взяли на вооружение такие компании, как OpenAI. Но это гораздо более схематичное (если не противозаконное) предложение рассматривать весь Интернет – материалы, защищенные авторским правом, и все такое – как объект захвата в головокружительной гонке за прибылью и доминированием.


    Иван Ковалев

    VIA





    Подписывайтесь и читайте новости от ITквариат раньше остальных в нашем Telegram-канале !



    Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!  




    И еще об интересном...
  • Прокси-серверы: что это за технология и кому она может быть полезна
  • Драйвер Nvidia Nouveau с открытым исходным кодом добавит поддержку HDMI 2.1 для графических процессоров Nvidia
  • Почему современные компьютерные игры используют так много видеопамяти?
  • Как Microsoft создает Xbox One X - самую мощную игровую консоль в мире (+видео)
  • Почему я вернул Macbook Pro через день использования и что я понял о будущем Apple
  • Xbox One vs PS4: Самое детальное сравнение двух платформ
  • LG G6: большой тест - обзор


  • А что вы думаете? Напишите в комментариях!
    Кликните на изображение чтобы обновить код, если он неразборчив



    В комментариях запрещено использовать ненормативную лексику, оскорблять других пользователей сайта, запрещены активные ссылки на сторонние сайты и реклама в комментариях. Уважаемые читатели! Просим вас, оставляя комментарии, уважать друг друга и не злоупотреблять свободой слова. Пользователи, которые нарушают эти правила грубо или систематически, будут заблокированы.

    Полная версия правил

Самое популярное
    
Проверьте скорость вашего интернета!


Что бывало...
Наши друзья
Сервисный центр Five Service

Магазин кабелей и аксессуаров UGREEN

Самоклейкин

Смарт



Видеостартап с искусственным интеллектом Runway без разрешения обучался на «тысячах» видеороликов YouTube




Компания Runway, занимающаяся искусственным интеллектом, без разрешения использовала «тысячи» видеороликов с YouTube и пиратских версий фильмов, защищенных авторским правом. 404 Media получили предполагаемые внутренние таблицы, в которых говорится, что стартап по созданию видео с использованием искусственного интеллекта обучил свою модель Gen-3, используя контент YouTube с таких каналов, как Disney, Netflix, Pixar и популярных СМИ.

Предполагаемый бывший сотрудник Runway рассказал, что компания использовала электронную таблицу, чтобы пометить списки видео, которые она хотела добавить в свою базу данных. Затем он загружал их с помощью прокси-программы с открытым исходным кодом, чтобы замести следы. На одном листе перечислены простые ключевые слова, такие как "космонавт", "фея" и "радуга", со сносками, указывающими, нашла ли компания соответствующие высококачественные видеоролики для обучения. Например, термин «супергерой» включает в себя примечание «Множество видеороликов».

Другие заметки показывают, что Runway отметил каналы YouTube с Unreal Engine, режиссером Джошем Нойманом и фан-страницей Call of Duty как хорошие источники обучающих видеороликов с «высоким движением».

«Каналы в этой таблице были попыткой всей компании найти видео хорошего качества для построения модели», — рассказал бывший сотрудник 404 Media. «Затем это было использовано в качестве входных данных для массового веб-сканера, который загружал все видео со всех этих каналов, используя прокси, чтобы избежать блокировки Google».

В списке из почти 4000 каналов YouTube, собранном в одной из электронных таблиц, такие каналы как CBS New York, AMC Theaters, Pixar, Disney Plus, Disney CD и аквариумом Монтерей-Бэй, отмечены как "рекомендуемые".

Кроме того, сообщается, что Runway составил отдельный список видео с пиратских сайтов. Таблица под названием «Источник, не связанный с YouTube» включает 14 ссылок на такие источники, как неавторизованный онлайн-архив фильмов Studio Ghibli, сайты с аниме и пиратскими фильмами, фан-сайт, на котором представлены видеоролики из игр Xbox, и сайт потоковой передачи анимаций Kisscartoon.sh.

В качестве убедительного подтверждения того, что компания использовала такие данные для обучения, 404 Media обнаружила, что запрос видеогенератору имен популярных YouTube-блогеров, перечисленных в электронной таблице, выдал результаты, имеющие сверхъестественное сходство. Важно отметить, что ввод одних и тех же имен в более старую модель Gen-2 от Runway, обученную до предполагаемых данных в электронных таблицах, привел к «несвязанным» результатам, например, к типичным мужчинам в костюмах. Кроме того, после того, как издание связалось с Runway и спросило о сходстве ютуберов в результатах, инструмент искусственного интеллекта вообще перестал их генерировать.

«Я надеюсь, что, поделившись этой информацией, люди лучше поймут масштаб этих компаний и то, что они делают, чтобы создавать «крутые» видеоролики», — сказал бывший сотрудник 404 Media.

По крайней мере, некоторые компании, занимающиеся искусственным интеллектом, стремятся нормализовать свои инструменты и занять лидирующие позиции на рынке, прежде чем пользователи – и суды – поймут, как именно они это делали. Обучение с разрешения посредством лицензионных сделок — это одно, и это еще одна тактика, которую недавно взяли на вооружение такие компании, как OpenAI. Но это гораздо более схематичное (если не противозаконное) предложение рассматривать весь Интернет – материалы, защищенные авторским правом, и все такое – как объект захвата в головокружительной гонке за прибылью и доминированием.


Иван Ковалев

VIA





Подписывайтесь и читайте новости от ITквариат раньше остальных в нашем Telegram-канале !



Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!  




И еще об интересном...
  • Прокси-серверы: что это за технология и кому она может быть полезна
  • Драйвер Nvidia Nouveau с открытым исходным кодом добавит поддержку HDMI 2.1 для графических процессоров Nvidia
  • Почему современные компьютерные игры используют так много видеопамяти?
  • Как Microsoft создает Xbox One X - самую мощную игровую консоль в мире (+видео)
  • Почему я вернул Macbook Pro через день использования и что я понял о будущем Apple
  • Xbox One vs PS4: Самое детальное сравнение двух платформ
  • LG G6: большой тест - обзор


  • А что вы думаете? Напишите в комментариях!
    Кликните на изображение чтобы обновить код, если он неразборчив



    В комментариях запрещено использовать ненормативную лексику, оскорблять других пользователей сайта, запрещены активные ссылки на сторонние сайты и реклама в комментариях. Уважаемые читатели! Просим вас, оставляя комментарии, уважать друг друга и не злоупотреблять свободой слова. Пользователи, которые нарушают эти правила грубо или систематически, будут заблокированы.

    Полная версия правил
    ITквариат (АйТиквариат) Powered by © 1996-2024