Автоматическое ключевание видео с помощью ИИ

На сервис автоматического ключевания PhotoTag добавили возможность загружать и ключевать видео. Решил попробовать загрузить пару видео файлов из своих старых роликов, которые довольно неплохо продавались на фотостоках.

Сами ролики показывать не буду, просто опишу что там было и как PhotoTag их проключевал:

1) Ролик 1: крупный план рук, которые печатают на клавиатуре ноутбука (макбук), который стоит на столе в кафе, фон не в фокусе.

Результат:

  • Title: Productive Afternoon at a Cozy Cafe: Freelancer Working on Laptop
  • Description: A focused individual engages in work on their laptop at a rustic cafe during a calm afternoon.
  • Keywords: freelancer,laptop,work,cafe,afternoon,productivity,technology,rustic,calm,focused,typing,remote work,coffee shop,individual,professional,mobile office,digital nomad,wooden table,comfortable,indoor,wireless communication,internet,keyboard,modern lifestyle,email,online,business,entrepreneur,project,research,cozy atmosphere,casual,occupation,screen,software,user,web browsing,connectivity,design,planning

В целом алгоритм понял, что на экране, это плюс, но на мой взгляд много лишних ключевых слов (хотя это, видимо, из-за того, что я указал сгенерировать 40 ключевых), а вот такие слова как closeup или hands совсем не добавил.

2) Ролик 2: азиатские студенты сидят за столами в коворкинге-кафе занимаются и разговаривают, вид немного сверху и сбоку.

Результат:

Title: Busy Urban Coffee Shop Scene With Diverse Patrons Working and Socializing

Description: This video captures the vibrant atmosphere of a bustling coffee shop, where patrons are seen deeply engaged in work, conversation, and leisure activities.

Keywords: coffee shop,patrons,working,socializing,social,laptops,urban,busy,diverse,café,leisure,people,studying,meeting,friends,conversation,coffee,drinks,tables,chairs,interior,casual,gathering,work,freelance,reading,writing,customers,ambiance,lifestyle,community,wifi,productivity,barista,city,culture,daily life,refreshments,technology

Во втором ролике, на мой взгляд, несмотря на то, что сцену он понял, но алгоритм промахнулся немного в деталях. Ему, наверное, сложно отличить посетителей и студентов, но на мой взгляд тут разница довольно существенная. Не знаю почему он зацепился за слово patrons, которое здесь не очень подходит. Я считаю, что главные слова тут должны быть studying и students, и если первое есть хотя бы в ключевых словах, то второго вообще нет. Pupils тоже бы подошло, а вот barista на видео совсем нет.

Вывод

В принципе ожидаемо, что с видео результаты будут не такие хорошие как автоматическим ключеванием фотографий, но в целом работать можно. Хотя, если бы я снимал видео, с учетом затрат на съемку и потенциальной прибыли, видео я бы ключевал вручную. ИИ в данном случае можно использовать как дополнительный сервис, который может предложить неожиданные слова, тем более, что стоит он очень дешево.

Не забудьте подписаться на наш Telegram канал с актуальными новостями о фотостоках и интересной информацией. Коротко и полезно.

Похожие записи:

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *