Uporaba umetne inteligence za povzemanje in analitično obravnavo videoposnetkov

Pavčnik, Luka

Uporaba umetne inteligence za povzemanje in analitično obravnavo videoposnetkov
ID Pavčnik, Luka (Avtor), ID Rožanc, Igor (Mentor) Več o mentorju... Povezava se odpre v novem oknu

PDF - Predstavitvena datoteka, prenos (3,64 MB)
MD5: 35355815A061B2110CFE65AAB3A38A42

Izvleček

Diplomska naloga obravnava problem učinkovitega povzemanja in analize videoposnetkov z uporabo umetne inteligence. Izziv predstavlja hitro pridobivanje ključnih informacij iz dolgih videoposnetkov, kar je posebej pomembno v izobraževalnem in raziskovalnem kontekstu. Pristop temelji na integraciji naprednih modelov umetne inteligence kot sta Whisper za pretvorbo govora v besedilo in GPT za analizo vsebine. Razvita je bila spletna aplikacija, ki omogoča samodejno generiranje povzetkov, ključnih točk in odgovarjanje na vprašanja o vsebini videoposnetkov. Na izbranem videoposnetku so rezultati pokazali, da aplikacija uspešno tvori jasne in natančne informacije. Ključni prispevek je implementacija rešitve za obdelavo daljših videoposnetkov in izboljšanje kakovosti podnapisov še zlasti za slovenske vsebine, kar znatno razširja uporabnost aplikacije za različne tipe videoposnetkov v različnih jezikovnih okoljih.

Jezik:	Slovenski jezik
Ključne besede:	umetna inteligenca, veliki jezikovni modeli, openAI, whisper, GPT
Vrsta gradiva:	Diplomsko delo/naloga
Tipologija:	2.11 - Diplomsko delo
Organizacija:	FRI - Fakulteta za računalništvo in informatiko
Leto izida:	2024
PID:	20.500.12556/RUL-162286
COBISS.SI-ID:	214136579
Datum objave v RUL:	20.09.2024
Število ogledov:	158
Število prenosov:	47
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
Naslov:	Using artificial inteligence for video summarization and analytical processing
This thesis addresses the challenge of efficiently summarizing and analyzing video content using artificial intelligence. The solution lies in quick extraction of key information from lengthy videos, which is particularly crucial in educational and research contexts. The approach integrates advanced AI models such as Whisper for speech-to-text conversion and GPT for content analysis. A web application was developed that enables automatic generation of summaries, key points, and answers to questions about video content. Results from a selected video demonstrated that the application successfully produces clear and accurate information. The key contribution is the implementation of a solution for processing longer videos and improving subtitle quality, especially for Slovenian content, significantly expanding the application's usability across different language environments and video types.
Ključne besede:	artificial intelligence, large language models, openAI, whisper, GPT

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj