Ezhe.ru архив
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Мусор в Сети
Здравствуйте, Михаил, ЕЖЕ!
 Уже давно читал, что первыми это осознали и использовали в своей
почте в Гугле. Думаю и в youtube давно применяется сжатие видео
в общее хранилище.
//Михаил Крайнов
Да, они просто первыми столкнулись с ТАКИМИ объёмами данных и напоролись 
на бигдату -- то количество данных, которое не возможно хранить и 
обрабатывать привычными средствами.
 Наши в этой алгоритмике отстают, и в том числе потому и
испытывают нехватку серверов.
Имеет смысл делать не конкретные тематические
контентные проекты, а услугу упакованного облачного хранения
информации различных медийных видов и быстрого доступа к ней.
Возможно где-то в Яндексе или Вк что-то подобное для себя
уже мутят.
//Михаил Крайнов
Это не совсем так. Во-первых, как ни странно, основная проблема даже не 
в нехватке серверов, а в нехватке помещений, куда эти сервера можно 
поставить. А у помещений проблема в подведнии электричества к машинным 
залам. Конечно, у нас само электричество хотя бы есть в достаточном 
количестве и проблема чисто инженерная -- проложить линии, развести, 
всякую там пром. безопасность доработать Но тем не менее, это бывает 
сложно. А вот самих помещений просто мало, и даже при наличии просто 
денег нельзя вот взять и поставить 40 своих стоек, где хочется.
А с самими технологиями у Яндекса и ВК всё весьма неплохо, вполне на 
уровне с их западными конкурентами. Лет 8 ещё назад (или даже пораньше) 
ВК выступали на Хайлоаде с докладом, как они хранят фотки пользователей, 
в общем-то ничего принципиально с тех пор не изменилось. Опущу 
технические нюансы и детали, объясню идею на пальцах:
фотография загружается в мемкеш (ОЗУ) и реплицириутеся (копируется) на 
парочку машин, чтобы и они могли эту фотографию отдать. Параллельно эта 
фотография кладётся на жёсткий диск. Если фотографию смотрят много и 
часто, её копия находится в мемкеше (ОЗУ) большого количества машин 
(опять-таки, исключительно для скорости обслуживания запросов 
пользователей), а если какое-то время ни одного обращения к фотографии 
не было, то она вообще удаляется из мемкеша, чтобы освободить ценное 
место для более популярных фотографий. Бэкапов нет (это безумно дорого и 
нет мотивации для ВК платить из своего кармана за это), поэтому если 
фотки никто не смотрит, то при поломке жёсткого диска (а это регулярно 
происходит, харды это расходник в таких системах,) фотография пропадёт 
на совсем. Это легко пронаблюдать, полазив по каким-нибудь старым 
профилям ВК, в которые давно никто не заходил -- там не получится 
посмотреть фотки. Соответственно, если фотографию смотрят, то при 
поломке харда копия этой фотографии будет загружена на новый хард из 
мемкеша.
На том же Хайлоаде в этой же секции был и доклад от Фейсбука про то, как 
они хранят фотки, и в общем-то примерно то же самое, но немного другой 
алгоритм (логика и правила) отправки фотографии из мемкеша на хард.
Яндекс тоже не отстаёт и делает у себя аналог гугловского набора 
технологий (который продаётся наружу в виде всяких там Google BigQuery и 
прочих облачных бигдатых штук). Тут вопрос не столько квалификации, 
сколько реальной потребности, всё-таки тот же Гугл обрабатывает 
существенно большие объёмы данных, чем Яндекс, и у них уже и инженерные 
задачи звучат по-другому.
--
Best,
    D.
Оценить письмо Reputatio: http://ezhe.ru/reputatio/49b2a4e1af
Home |
Main Index |
Thread Index