Spaces:

Ane4ka
/

NoteMaker

Sleeping

NoteMaker / README.md

Update README.md

d05a6fe verified 18 days ago

1.45 kB

	---
	title: NoteMaker
	emoji: 🏢
	colorFrom: blue
	colorTo: yellow
	sdk: gradio
	sdk_version: 6.0.2
	app_file: app.py
	pinned: false
	short_description: Make your own notes
	---

	# NoteMaker

	## Краткое описание

	Проект представляет собой систему, которая принимает на вход изображение с английским текстом
	и последовательно выполняет три шага:
	- распознавание текста,
	- анализ тональности текста,
	- составление сжатого конспекта,
	- озвучивание полученного конспекта.

	## Архитектура системы

	![Архитектура](https://drive.google.com/uc?export=view&id=1fSIHb79Bn48TBWobKzrRgOjSFwd62hyv)

	## Использованные модели

	Распознавание текста выполняется EasyOCR.

	Распознанный текст подаётся в модель distilbert-base-uncased-finetuned-sst-2-english для определения тональности.

	Для сжатия текста до конспекта используется модель sshleifer/distilbart-cnn-12-6.

	Полученный конспект передаётся в модель facebook/mms-tts-eng (VITS), которая генерирует аудио в формате WAV.