Дистрибутив Linux Gentoo ввел тотальный запрет на любые изменения, подготовленные с помощью ИИ
Linux без ИИ в разработке
Разработчики дистрибутива Linux Gentoo отказались включать любые изменения, полученные при помощи генеративного искусственного интеллекта, пишет The Register.
Полностью запрещены к использованию чат-боты OpenAI ChatGPT и Google Bard, ассистенты программиста вроде GitHub Copilot, принадлежащего Microsoft. Запрет распространяется применение ИИ-инструментов при создании ebuild (сценарии для системы управления пакетами Portage в Gentoo), программного кода, документации, багрепортов (сообщения об ошибках).
Соответствующая мера первоначально была предложена 27 февраля 2024 г. Михалом Гурны (Michał Górny), избранным членом управляющего совета проекта Gentoo – комитета, координирующего развитие дистрибутива. В числе причин, по которым, Гурны счел введение запрета сгенерированного ИИ контента необходимым: потенциальные проблемы с авторскими правами, контролем качества и этические соображение, касающиеся высокого энергопотребления систем, которые обеспечивают работу ИИ-сервисов, а также причастности технологических гигантов к развитию технологии.
Первое обсуждение предложенного запрета состоялось 10 марта в ходе ежемесячной встречи членов комитета. Однако добиться его одобрения Гурны удалось лишь 14 апреля – после того, как были уточнены спорные формулировки. Голосование по инициативе завершилось со счетом 6:0 в пользу введения запрета. Один из членов комитета на голосование не явился.
Мера носит превентивный характер, отмечает The Register. Другими словами, ответственные за развитие проекта решили не дожидаться первого инцидента, а как можно быстрее принять меры, которые направлены на предотвращение возникновения проблем, связанных с использованием ИИ.
Проблемы с копирайтом
Технологические гиганты, по мнению Гурны, не брезгуют нарушением копирайта, в результате чего защищенные авторским правом фрагменты кода могут «всплыть» в файлах проекта, что приведет к неприятным правовым последствиям уже для проекта Gentoo.
В последнее время к владельцам генеративных моделей, используемых в коммерческих целях, возникает немало претензий со стороны обладателей авторских прав на различные виды контента – текст, изображения и др., которые могли быть применены в качестве набора данных для обучения нейросетей.
Например, в марте 2024 г. к Nvidia, производителю востребованных ИИ-ускорителей, был подан коллективный иск. В нем компанию обвинили в незаконном использовании датасета Books3 при обучении больших языковых моделей семейства Megatron. Books3 содержит тексты более чем 196 тыс. книг. Некоторые из них принадлежат перу истцов по делу и защищены авторскими правами.
В 2022 г. в суд на Microsoft подала группа разработчиков ПО, уверенные в том, что корпорация использовала для обучения своего сервиса GitHub Copilot чужой код, распространяемый на условиях свободных лицензий.
Сомнительное качество кода
Сомнения по поводу качества генерируемого ИИ кода, высказанные Гурны, обусловлены, в частности, склонностью моделей к «галлюцинациям» – даже самых лучших из них. По мнению одного из лидеров проекта Gentoo, умные ассистенты способны оказать программистам серьезную помощь при соблюдении пользователями должного уровня осторожности. Однако проект не может всецело полагаться на сознательность и профессионализм абсолютно всех его участников, а необходимость в проведении более тщательного рецензирования кода может серьезно увеличить трудозатраты команды.
Как ранее сообщил CNews, эксперимент Бара Ланьядо (Bar Lanyado) из ИБ-компании Lasso Security выявил критическую уязвимость в процессе разработки ПО – возможность генеративного ИИ предлагать ко включению в код несуществующие пакеты, которые впоследствии могут быть созданы злоумышленниками и использованы для кибератак через цепочки поставщиков.
В ходе эксперимента «на крючок» исследователя безопасности попались крупные китайские технологические компании Alibaba, Tencent и Baidu, включившие несуществующий Python-пакет huggingface-cli в свою документацию – его, согласно наблюдениям Ланьядо, нередко предлагали существующие ИИ-инструменты генерации кода.
PR-ход, не имеющий реальных последствий?
В своем обращении к сообществу Gentoo в почтовой рассылке Гурны противопоставляет ценности больших корпораций, в руках которых находятся мощнейшие ИИ-сервисы, и команды, которую представляет он.
По его мнению, технологическим гигантам нет дела не только до соблюдения копирайта, но и до судеб людей. Раздувание «ИИ-пузыря» ведет к колоссальным расходам электроэнергии, легитимизирует массовые увольнения сотрудников и дальнейшее увеличение масштабов эксплуатации ИТ-персонала, ведет к деградации интернета и провоцирует рост объемов спама и мошенничества в Сети, считает Гурны.
«Gentoo всегда выделялся чем-то особенным, чем-то, чего людям не хватало в мейнстримных дистрибутивах», – отметил представитель проекта.
Запрет на использовании ИИ в Gentoo, вероятно, следует расценивать как в том числе и своеобразный PR-ход. Дистрибутив, который поддерживается исключительно силами реальных людей, может привлечь консервативных представителей Linux-сообщества, использующих другие сборки. В то же время надежные инструменты обеспечения выполнения запрета в распоряжении лидеров Gentoo отсутствуют, что Гурны, очевидно, осознает.
«Наша основная цель – прояснить, что приемлемо, а что нет, и вежливо попросить участников проекта относиться к правилам с уважением», – отметил он.
Исключения возможны
В дальнейшем запрет может быть смягчен – к примеру, комитет допускает появление исключения из правил для ИИ-инструментов, которые гарантировано не имеют проблем с авторским правом.
Некоторые факты о Gentoo
Gentoo – универсальный дистрибутив GNU/Linux, первый релиз которого состоялся в 2002 г. Одна из главных «фишек» Gentoo – применение технологии Portage, которая по принципу работы напоминает систему управления пакетами ОС FreeBSD (так называемые порты). Portage позволяет как устанавливать ПО из предварительно собранных бинарных пакетов, так и собирать программы из исходных текстов – с оптимизацией под конкретное оборудование и без особых навыков программирования.
По данным Distrowatch.com, в рейтинге популярности дистрибутивов Linux и других Unix-подобных ОС за последние 12 месяцев Gentoo занимает 57 строчку, уступая одну позицию Xubuntu. В тройке лидеров – MX Linux, Mint и EndeavourOS.