Если вы все еще сомневались, что контент, который вы публикуете в Интернете, будет передан моделям ИИ, ознакомьтесь с обновленной политикой конфиденциальности Google. Теперь в документе прямо говорится, что компания оставляет за собой право собирать и анализировать почти все, чем люди делятся в Интернете, для обучения своих систем искусственного интеллекта.
Ранее документ заявлял, что данные пользователей будут использоваться для обучения «языковых» моделей, упоминая только Google Translate. В обновленной версии это изменено на «модели ИИ», в частности упоминаются Bard и Cloud AI вместе с Translate.
Одна из многих спорных проблем с генеративными системами искусственного интеллекта, такими как ChatGPT и Bard, — это то, как они очищают и используют данные. Это может быть общедоступная информация, но это не решает проблем плагиата и конфиденциальности, не говоря уже о возможности того, что ИИ неправильно истолковывает сказанное или предлагает устаревшие ответы. Даже Google предупредил сотрудников, чтобы они были осторожны при использовании чат-ботов, таких как собственный Bard, поскольку они могут делать нежелательные предложения по коду.
Также возникает вопрос, является ли этот вид очистки данных законным. Компания OpenAI, создавшая ChatGPT, уже столкнулась с судебными исками по обвинению в незаконном сборе личной информации пользователей Интернета и использовании этих данных для создания своих продуктов.
OpenAI также ведет судебный процесс по поводу нарушения авторских прав и нарушений конфиденциальности, связанных с утверждениями о том, что она без разрешения использовала книги, защищенные авторским правом, для обучения своих систем искусственного интеллекта. Компания якобы незаконно скопировала текст, не получив согласия правообладателей и не предоставив им компенсацию.
Очистка данных кажется особенно неприятной темой для Илона Маска. Твиттер на выходных временно ограничил количество твитов, которые пользователи могут читать в день, якобы для устранения «экстремальных уровней» очистки данных и «манипуляций с системой» на платформе — хотя не все согласны с тем, что это было причиной ограничения.
Reddit также столкнулся с множеством проблем после отключения бесплатного доступа к своим API для прекращения сбора данных. Этот шаг привел к тому, что более 8000 субреддитов отключились в знак протеста, а некоторые перешли на NSFW.
Иван Ковалев
VIA