Apple выпустила языковые модели OpenELM с открытым исходным кодом


Apple выпустила языковые модели OpenELM с открытым исходным кодом


Компания Apple представила серию языковых моделей с открытым исходным кодом, известных как OpenELM, которые способны функционировать непосредственно на устройствах пользователя, минуя необходимость подключения к облачным серверам. Эти модели доступны через Hugging Face Hub, платформу для обмена кодами в сфере искусственного интеллекта. Об этом сообщает издание “3DNews” 

Из документации Apple становится известно, что доступны восемь разнообразных моделей OpenELM. Половина из них была предварительно обучена с использованием библиотеки CoreNet, в то время как оставшиеся четыре модели были настроены для выполнения специфических инструкций. 

Компания применяет методику слоевого масштабирования своих ИИ, что способствует улучшению их точности и общей производительности. Программистам предоставляется выбор из моделей OpenELM с различными объемами параметров: от 270 миллионов до 3 миллиардов. Эти параметры являются ключевыми элементами в процессе принятия решений моделью на основе данных, с которыми она была обучена. 

Для сравнения, новейшая модель Phi-3 от Microsoft обладает 3,8 миллиарда параметров, а модель Gemma от Google — 2,2 миллиарда. Меньшие по размеру модели являются более экономически выгодными для использования и оптимизированы для устройств с ограниченными ресурсами, таких как смартфоны и ноутбуки. 

Apple предлагает использовать OpenELM под “лицензией на образец кода”, позволяющей пользователям работать с различными контрольными точками обучения, статистикой использования моделей, а также руководствами по их предварительному обучению, настройке и оценке эффективности. Несмотря на то что данная лицензия не ограничивает коммерческое использование или модификацию кода, она требует, чтобы при распространении программного обеспечения также передавался текст лицензии и отказ от ответственности. Этот отказ указывает на то, что компания не гарантирует безопасность работы программ и признает возможность возникновения ошибок, предвзятости, неподходящих или даже вредных результатов в ответах системы.]]>


Поделиться с другом

Комментарии 0/0