Ezhe.ru архив
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Мусор в Сети
> если нарисовать онтологию, там не будет миллионов признаков. Максимум
несколько десятков // Кудрявцев.
Там не нужно никаких признаков. И не нужно никакой онтологии.
Это не печатный сборник.
К каждой песне нужен её текст и краткое текстовое описание - название,
автор, где и когда выступал. Хочется искать по жанру - добавить в описание
жанр. По тональности - упомянуть тональность и т.п.
Тематики песен даже описывать не нужно, всё есть в тексте.
Дальше всё сделает индексно-поисковая машина, каждое слово описания и песни
- признак.
Отдельно взять из общедоступных источников биографии авторов, добавить к
песням или сборникам. Тоже заиндексировать поисковиком.
Поисковики доступны бесплатно, в опенсорсе.
Прикольно, что в принципе можно тексты вообще распознать автоматически,
будет шум, но искать это не помешает.
Если хочется иметь ещё и каталог, его нужно просто нарисовать один раз и
разложить песни и авторов ручками, мышкой, один раз.
Игорь Ашманов.
Оценить письмо Reputatio: http://ezhe.ru/reputatio/922bd6d5fc
Home |
Main Index |
Thread Index