![Фото из архива](https://img.belta.by/images/storage/news/with_archive/2024/000025_1729281846_669343_big.jpg)
"Итак, мы выпустили Self-Taught Evaluator - новый метод генерации синтетических данных предпочтений для модели вознаграждения, не основываясь на комментариях человека", - говорится в сообщении.
Моделирование вознаграждения - это подход машинного обучения искусственного интеллекта на основе обратной связи, оценки или подсказки.
Из релиза Meta следует, что новый подход включает в себя процесс выстраивания логических цепочек на основе непрерывной схемы самосовершенствования модели.
Кроме того, компания сообщила о выпуске генеративной модели вознаграждения на основе прямой оптимизации предпочтений в инструменте машинного обучения RewardBench, основанной на данных без использования пояснений человека.
Компания Facebook в 2021 году объявила о переименовании в Meta. Ее создатель Марк Цукерберг заявил, что новый бренд делает акцент на метавселенной, где человек откажется от экранов и будет испытывать эффект присутствия в виртуальной реальности.
БелТА