Конвертуйте PDF-документи в подкасти: Meta презентує NotebookLlama - Радіо Максимум


Календар посівів на листопад 2024 року за місячними фазами: які культури висаджувати і в які терміни.

Meta випустила "відкриту" версію популярної функції створення подкастів NotebookLM від Google. Проєкт під назвою NotebookLlama використовує власні моделі Llama від Meta для більшої частини обробки.

Цю інформацію повідомляє TechCrunch.

До слова: Сучасний оркестр: робот вперше в історії зіграв на віолончелі на сцені

Спочатку NotebookLlama генерує стенограму з файлу, наприклад, з PDF-документа новини або блогу. Далі вона вводить елементи "драматизації" та паузи, щоб надати більшу реалістичність, перш ніж передати транскрипцію до відкритих моделей перетворення тексту в мовлення. Після цього текст обробляється відкритими моделями синтезу мовлення, щоб створити аудіоверсію.

Користувачі зазначають, що результати звучать менш вражаюче, ніж у NotebookLM. Голоси мають помітно штучний відтінок і часто накладаються один на одного в незрозумілих моментах. Проте, дослідники з Meta, які розробляють цей проєкт, стверджують, що з використанням потужніших моделей можливо досягти кращої якості.

Модель перетворення тексту в мову є обмеженням того, наскільки природно це звучатиме, - пишуть дослідники Meta на сторінці NotebookLlama на GitHub. Інший підхід до написання подкасту полягає в тому, що два агенти обговорюють тему, яка їх цікавить, і пишуть план подкасту. Зараз ми використовуємо єдину модель для написання плану подкасту.

Related posts