Python

영상의 자막을 이용하여 내용을 추출하기(유튜브)

DevHam94 2024. 12. 23. 01:51

영상 그 자체를 사용하여 영상 내용을 ai에게 분석을 부탁할 수도 있겠지만. 아직은 영상을 이용하는 방법은 token비용이 너무 많이 들어가기 때문에 영상에 사용되는 자막을 이용하는 방법이 많이 사용된다. 

 

https://github.com/jdepoix/youtube-transcript-api

 

GitHub - jdepoix/youtube-transcript-api: This is a python API which allows you to get the transcript/subtitles for a given YouTu

This is a python API which allows you to get the transcript/subtitles for a given YouTube video. It also works for automatically generated subtitles and it does not require an API key nor a headles...

github.com

위의 api를 이용한다. 

pip install youtube-transcript-api

터미널에 입력하여 라이브러리를 다운받아준다. 

 

 

from youtube_transcript_api import YouTubeTranscriptApi

YouTubeTranscriptApi.get_transcript(video_id)

 

video_id에는 원하는 영상의 상단의 주소창에 get방식으로 나와있는 v값을 입력해주면 된다.