Фото: Газета «Синьцзин бао»
Большая языковая модель искусственного интеллекта (ИИ) для преобразования текста в видео под названием Vidu, способная в одно нажатие создавать 16-секундные видеоролики высокой четкости с разрешением 1080p, была представлена 27 апреля на форуме «Чжунгуаньцунь 2024» в Пекине.
Разработанная Университетом Цинхуа и китайской ИИ-компанией ShengShu Technology, Vidu является первой в Китае большой ИИ моделью для видеогенерации, которая обладает «увеличенной продолжительностью, исключительной согласованностью и динамическими возможностями».
По словам Чжу Цзюня, заместителя директора Института искусственного интеллекта Цинхуа, Vidu, будучи созданной в Китае большой моделью ИИ, способна понимать и генерировать такие китайские элементы, как панда и лун (китайский дракон).
Как отметили в ShengShu Technology, архитектура ядра Vidu была представлена уже в 2022 году.