Одна из вещей, которая, наряду с Инстаграмом и вездесущими Сторис, меня бесит до невероятия — это ставший уже несколько лет популярным жанр «видео-туториалов» на Youtube.
Вот стоит говорящее тело, и 18 минут шевеля руками говорит ртом. 4 минуты на экране, он еще к сути не приступал. И все 18 минут он вот в такой позе говорит и говорит. У него тут хоть сабы есть и разделы видео размечены, и английский хороший, не «ви виль иксплейнь хоу ит ворьк ин нексть ван хоур видио туториаль».
Мне из этих 18 минут нужно от силы минута-две где-то в середине, но найти их не посмотрев и не потратив 18 минут жизни — невозможно.
При этом уже существует софт, который довольно неплохо раскодирует аудио речь в текст (поразительно хорошо, кстати, смотрите whisper). Есть AI-based сервисы, которые из длинного «потока сознания» могут вычленить суть и сделать короткую, на пару абзацев выжимку-резюме. Переводчики (по крайней мере с английского) уже прям фундаментального прорыва достигли. Осталость это все собрать вместе
Хочу плагин к браузеру, которому тыкаешь на видео, а он тебе: «В этом видео говорится следующее: … (сохранить в file.txt?)»
В области всяких гаджетов и мелкой электроники есть правило: «Если тебе что-то надо необычное, то не спеши садиться разрабатывать и паять, поищи на Алиэкспрессе, наверняка уже кто-то такое сделал и даже продает.»
Почти уверен, что такое, что мне надо — уже существует. Я даже пару платных нашел уже. Но технически нет никакой причины этому не быть, нужно такое наверняка далеко не одному мне.
Вот, как вариант:
https://github.com/josStorer/chatGPTBox
О как они меня бесяяяят! Я вообще ненавижу видео с говорящими головами, но я, похоже, в сильном меньшинстве….