Ezhe.ru архив

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Мусор в Сети



>  если нарисовать онтологию, там не будет миллионов признаков. Максимум
несколько десятков // Кудрявцев. 

Там не нужно никаких признаков. И не нужно никакой онтологии.
Это не печатный сборник.

К каждой песне нужен её текст и краткое текстовое описание - название,
автор, где и когда выступал. Хочется искать по жанру - добавить в описание
жанр. По тональности - упомянуть тональность и т.п.
Тематики песен даже описывать не нужно, всё есть в тексте.

Дальше всё сделает индексно-поисковая машина, каждое слово описания и песни
- признак.

Отдельно взять из общедоступных источников биографии авторов, добавить к
песням или сборникам. Тоже заиндексировать поисковиком.
Поисковики доступны бесплатно, в опенсорсе.

Прикольно, что в принципе можно тексты вообще распознать автоматически,
будет шум, но искать это не помешает.

Если хочется иметь ещё и каталог, его нужно просто нарисовать один раз и
разложить песни и авторов ручками, мышкой, один раз.

Игорь Ашманов. 

Оценить письмо Reputatio: http://ezhe.ru/reputatio/922bd6d5fc


Home | Main Index | Thread Index