Ezhe.ru архив

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Мусор в Сети



>
> каждая (каждая!) видео-аудиозапись имеет 100500 возможных критериев
> запроса. Не буду углубляться, короткий пример: коллектив "Песни нашего
> века", концерт 1999 год, зал Дома Кино. Запрос может быть по каждому из
> исполнителей, каждому из авторов стихов/музыки исполняемых песен, каждому
> названию или первой строчке исполнявшихся песен и еще много по чему. / Ревич
>

И чего? Во-первых, если нарисовать онтологию, там не будет миллионов
признаков. Максимум несколько десятков и их никто никогда не заполняет
полностью, а достраивает в режиме краудсорсинга, как википедию дописывают.
Во-вторых - размечают же индусы большие данные и не пищат? Реально за 300 р
в день. Простые действия, анализ длиной в несколько секунд на признак, по
признаку - два на человека и вот уже конвейер.


> заговорил с самого начала о задаче куда более высокого порядка - о
> создании СИСТЕМЫ цифровых архивов. Будь хотя бы стандартизированный шаблон,
> который не надо изобретать каждый раз заново - уже работа такого
> специалиста намного облегчилась. / Ревич
>

Ненене, если система = ИТ-решение, то ни в коем случае. Если методология
разметки - то да, куда ж без нее. Но это упражнение для любого спеца по
цифровым архивам из десятка интеграторов страны, на пару вечеров. Главное,
чтобы он бардовской песней увлекался. Клич кинуть и будет вам эксперт.

Библиотечный стандарт описания объекта хранения MARC (про книжки) наверняка
имеет форки про арт. Если и не имеет - выключил ненужные поля в настройке
шаблона, пометил обязательные и оставил опциональные. Всё. Адресное
хранение дисков - дело одного дня, разложить по нумерованным ячейкам. И
всё, заливай копию в облако, зови толпу размечать всем на пользу и вот вам
проект. Пережуют только так.

Оценить письмо Reputatio: http://ezhe.ru/reputatio/e529805388


Home | Main Index | Thread Index