Ezhe.ru архив

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Мусор в Сети




Здравствуйте, Михаил, ЕЖЕ!

 Уже давно читал, что первыми это осознали и использовали в своей
почте в Гугле. Думаю и в youtube давно применяется сжатие видео
в общее хранилище.
//Михаил Крайнов

Да, они просто первыми столкнулись с ТАКИМИ объёмами данных и напоролись на бигдату -- то количество данных, которое не возможно хранить и обрабатывать привычными средствами.

 Наши в этой алгоритмике отстают, и в том числе потому и
испытывают нехватку серверов.

Имеет смысл делать не конкретные тематические
контентные проекты, а услугу упакованного облачного хранения
информации различных медийных видов и быстрого доступа к ней.
Возможно где-то в Яндексе или Вк что-то подобное для себя
уже мутят.
//Михаил Крайнов

Это не совсем так. Во-первых, как ни странно, основная проблема даже не в нехватке серверов, а в нехватке помещений, куда эти сервера можно поставить. А у помещений проблема в подведнии электричества к машинным залам. Конечно, у нас само электричество хотя бы есть в достаточном количестве и проблема чисто инженерная -- проложить линии, развести, всякую там пром. безопасность доработать Но тем не менее, это бывает сложно. А вот самих помещений просто мало, и даже при наличии просто денег нельзя вот взять и поставить 40 своих стоек, где хочется.

А с самими технологиями у Яндекса и ВК всё весьма неплохо, вполне на уровне с их западными конкурентами. Лет 8 ещё назад (или даже пораньше) ВК выступали на Хайлоаде с докладом, как они хранят фотки пользователей, в общем-то ничего принципиально с тех пор не изменилось. Опущу технические нюансы и детали, объясню идею на пальцах: фотография загружается в мемкеш (ОЗУ) и реплицириутеся (копируется) на парочку машин, чтобы и они могли эту фотографию отдать. Параллельно эта фотография кладётся на жёсткий диск. Если фотографию смотрят много и часто, её копия находится в мемкеше (ОЗУ) большого количества машин (опять-таки, исключительно для скорости обслуживания запросов пользователей), а если какое-то время ни одного обращения к фотографии не было, то она вообще удаляется из мемкеша, чтобы освободить ценное место для более популярных фотографий. Бэкапов нет (это безумно дорого и нет мотивации для ВК платить из своего кармана за это), поэтому если фотки никто не смотрит, то при поломке жёсткого диска (а это регулярно происходит, харды это расходник в таких системах,) фотография пропадёт на совсем. Это легко пронаблюдать, полазив по каким-нибудь старым профилям ВК, в которые давно никто не заходил -- там не получится посмотреть фотки. Соответственно, если фотографию смотрят, то при поломке харда копия этой фотографии будет загружена на новый хард из мемкеша. На том же Хайлоаде в этой же секции был и доклад от Фейсбука про то, как они хранят фотки, и в общем-то примерно то же самое, но немного другой алгоритм (логика и правила) отправки фотографии из мемкеша на хард.

Яндекс тоже не отстаёт и делает у себя аналог гугловского набора технологий (который продаётся наружу в виде всяких там Google BigQuery и прочих облачных бигдатых штук). Тут вопрос не столько квалификации, сколько реальной потребности, всё-таки тот же Гугл обрабатывает существенно большие объёмы данных, чем Яндекс, и у них уже и инженерные задачи звучат по-другому.
--
Best,
    D.


Оценить письмо Reputatio: http://ezhe.ru/reputatio/49b2a4e1af


Home | Main Index | Thread Index