Изыскания эффективного использования технологии блокчейн охватывают не только сферу финансов и все, что с данной отраслью связано, но и такие отрасли, как распределенное информационное хранение. Дело в том, что, не смотря на сохраняющуюся популярность среди пользователей и эффективность, традиционные банки данных, а значит, абсолютно централизованные структуры, не лишены ряда серьезных проблем. Об этом факте красноречиво говорит громкая ликвидация файлообменника MegaUpload. Его сервера по приказу спецслужб США были физически «вырублены» провайдером LeaseWeb с последующей конфискацией. Разработчики ресурса загремели в места не столь отдаленные. Рассмотрим, чем же различаются централизованные и распределенные базы данных.
Факт! Известный и весьма востребованный сервис Dropbox также был неоднократно скомпрометирован. Примечательно то, что Dropbox в пику своим централизованным собратьям не кодирует информационный поток, хранящийся на его серверах. Любой децентрализованный информационный банк хранит данные своих пользователей исключительно в зашифрованном виде.
Распределенный банк информации: общие данные
Единое хранилище информации (не произвольная коллекция документов), индивидуально сберегаемой на разных узлах виртуальной конструкции, являющейся дифференцированной файловой системой, называется распределенная база данных (DDB или РБД). Информацию можно квалифицировать, как DDB лишь в том случае, если она взаимосвязана реляционной конструкцией с доступом, который предоставляет высокоуровневый единый интерфейс. Показатель уровня реплицированности у подобных хранилищ данных может быть разнообразным: от отсутствия какой-либо возможности копировать данные до всецелого информационного дубляжа абсолютно во всех дифференцированных прототипах – например, технологии блокчейн.
Механизм прозрачности
Дифференцирование информационного массива по огромному количеству нод (узлов), таким образом, чтобы для пользователя эта операция прошла незамеченной, называется термином «прозрачность». В свою очередь механизм распределения информации по вычислительным устройствам, включенным в общую сеть, является главной функцией для достижения децентрализации данных относительно непосредственно самой среды хранилища. Это достигается, благодаря нескольким типам прозрачности:
- системы (как следствие, прозрачность дифференцирования);
- репликации;
- фрагментации;
- доступа (осуществляется, как в централизованное хранилище).
В идеале, полная прозрачность подразумевает одинаковый язык запроса, как в случае с DDB, так с централизованной распределенной базой данных (БД).
Распределенные хранилища файлов
Дифференцированные файловые банки делятся на несколько видов:
- облачные хранилища;
- торренты.
Назвать децентрализованной распределенную базу данных облачного хранилища нельзя, так как всегда в подобной конструкции присутствует оператор, который арендует необходимое оборудование, либо обходится собственными мощностями. Именно частичная централизация архитектуры является основным минусом облачных хранилищ.
С торрентами ситуация противоположная. Хранение файлов – прерогатива обычных юзеров, которые, таким образом, вносят свою лепту в развитие архитектуры, предлагая сервис по сбережению данных. Взамен появляется возможность скачивать интересующие документы у других участников виртуальной системы. Это не исключает факт появления игроков с мощным оборудованием (серверами), поэтому, как не крути, все равно остается риск централизации цифровой конструкции. Но даже не в этом заключается основополагающий недостаток торрентов. Их главный минус – отсутствие стабильных и, что немаловажно, ощутимых привилегий (бонусов) для участников системы.
Важно! Здесь уместно вспомнить об ЭПС (электронной платежной системе) Permacoin с внутрисистемной кибермонетой. Платформа была разработана еще в 2010 году и позиционировалась как протокол схожий с торрентом. В данном контексте койн выступал инструментом вознаграждения юзеров за хранение «инфы».
Подводя промежуточный итог, становится понятно, что ни облачные сервисы, ни торренты нельзя в полной мере назвать децентрализованными архитектурами. Термин «распределенное хранилище данных» лучше всего подходит к этим конструкциям.
Однако коль скоро технология блокчейн лежит на поверхности решения проблемы централизации, уже претворено в жизнь некоторое количество проектов. Рассмотрим наиболее популярные из них.
STORJ
Цифровая архитектура начала свое функционирование в 2014 году. С помощью протокола Counterparty, являющегося надстройкой блокчейн, проект обзавелся собственной кибермонетой с торговым тикером SJCX. Сбережение «инфы» в рамках виртуальной конструкции осуществляется элементарно: документ, загружаемый юзером в экосистему, кодируется в таком русле, чтобы доступ к нему мог осуществить исключительно владелец файла. Конечный результат, в свою очередь, расчленяется на несколько составляющих и транспортируется в систему. В данной конструкции майнинг называется фарминг – то есть, процедура сдачи в аренду жесткого диска для хранения «инфы». Взамен – вознаграждение во внутрисистемной кибервалюте SJCX. На этапе становления проекта, чтобы начать осуществлять фарминг, юзер должен был владеть не менее чем 10 тыс. койнов в «местной» крипте. Стоимость хранения 1Gb «инфы» на этой платформе стоит 1,51$ (с учетом пропускной способности 30Gb/месяц).
Факт! Представители виртуального хранилища заявили о перемещении койна и значительной части цифровой конструкции на блокчейн Эфира (Ethereum). Мотив – медленное и дорогое обслуживание в рамках протокола Bitcoin. Как только телепортация осуществиться, следует ожидать снижение тарифов.
MaidSafe
Команда шотландских разработчиков трудилась над инфраструктурой децентрализованного хранилища MaidSafe с 2006 года. Внутренняя цифровая монета с торговым тикером MAID (MaidSafeCoin), созданная на базе протокола MasterCoin, который поддерживает свою жизнедеятельность поверх Биткойна, конвертируется на биржах с 2014 года. Для достижения паритета экосистема не применяет блокчейн – использование дифференцированного списка ограничивает эмиссия койнов, а также интегрирование некоторого дополнительного функционала. Текущая ситуация такова, что официальный сайт разработчиков может предложить пользователям лишь альфа-версию проекта. Точной даты выхода следующих релизов неизвестно.
Помимо сбережения «инфы» платформа предлагает юзерам безопасный доступ к БД, исключая посредников (третьих лиц). Проще говоря, никому не надо хранить записи о конфиденциальной информации или файлах юзера. Поэтому, доступ к БД есть только у владельца равно, как право дешифровки данных принадлежит ему. Общее количество документов, загруженных в экосистему, кодируются и впоследствии делятся на чанки (части), распространяющиеся по всей виртуальной системе. Доступ к итоговому документу и его чанкам, благодаря сложной аутентификации, имеется лишь у хозяина данных. Майнинг протекает, как и в предыдущей электронной конструкции с тем же названием процесса – фарминг. Вознаграждение – в виде монеты SafeCoin.
Важно! Чтобы стать владельцем SafeCoin, его можно обменять на MAID, которым активно торгуют на биржах уже достаточно долгое время.
SIA
Электронная структура с блокчейном похожим на технологию, которую использует «биток», функционирует с 2015 года. Принцип, на котором базируется работа хранилища, схож с логикой функционирования MaidSafe: документы юзера кодируются, делятся и рассеиваются по экосистеме. Третьи лица, к загруженным в систему данным, доступ не имеют, так как он осуществляется через закрытый ключ владельца этих данных. Бонус за предоставление в аренду дискового пространства с целью хранения информации выплачивается в одноименных койнах. Примечательно, сбережение 1 терабайта в рамках платформы SIA обойдется пользователю минимум в 10 раз дешевле, чем хранение аналогичного объема данных на таких площадках, как Amazon S3, Microsoft Azure.
Распределенные БД
Теорема CAP препятствует получению полной РБД, которая бы одновременно отвечала следующим характеристикам:
- согласованность;
- доступность;
- устойчивость к делению (БД продолжит свое функционирование, даже в том случае, если часть нод выйдет из экосистемы или сообщения от них перестанут поступать).
Однако требуется именно такая DDB, которая была бы устойчивой к дифференциации, а также доступной – ведь пользователь заинтересован получать нужный ответ (пускай неверный) в максимально сжатые сроки. Такая требовательность существенно ограничивает выбор до группы хранилищ информации NoSQL. К достоинствам этой категории БД относится высокая скорость обработки информации, линейное масштабирование с объемом хранилища, устойчивость к недоступности некоторой части копий, продуманные реализации. Минус один, но какой – слабая защита от проблемы «византийских генералов».
Важно! На первый взгляд – идеальная группа БД. Однако представьте, кто-то внес в сложнейший сборник БД некорректную копию, которая, немного немало, отдаст указание другим репликам удалить «инфу». Все. БД превратится в девственную территорию.
BigChainBD
Это реализация технологии блокчейн, которую частенько именуют, как IPDB (InterPlanetary DataBase). Позиционирует себя в качестве панацеи от всех проблем, связанных с процессом хранения «инфы». Разработчики платформы заявляют следующие технические параметры площадки:
- высокая скорость обработки операций – 1 млн./секунду;
- просто огромное по объему виртуальное хранилище (благодаря распределенному сбережению и частичным копированием);
- упрощенный консенсус в момент генерации блоков;
- хранение всей цепочки блоков в группе БД NoSQL (RethinkDB, MongoDB).
Значимая проблема, которая перевешивает все достоинства – каждая нода вправе осуществить запись в общее хранилище, что говорит о неустойчивости к ПВГ (проблеме византийских генералов). Примечательно, «разрабы» в курсе состояния дел и обещают в будущем разобраться с этой проблемой. Однако перестройка такого рода, как правило, на выходе дает совершенно новый продукт. В общем, такое несерьезное отношение основателей проекта к фундаментальной проблеме вызывает волну критики со стороны сообщества. Ведь показываемые высокие показатели скорости и объемов хранилища без защиты от ПВГ, имеют едва различимые отличия от характеристик групп БД NoSQL. А если учесть, что площадка для хранения «инфы» использует БД RethinkDB и MongoDB, встает очевидный вопрос, зачем такой посредник в лице BigChainBD.
Важно! Фактическое применение BigChainBD нашло себя в частном секторе – то есть, справедливо было бы назвать проект BigPrivateBlockChain (большой частный блокчейн). Для цифровых структур публичного толка эта платформа абсолютно не подходит.
В завершении…
Несколько слов о том, почему в блокчейне сегодня отсутствует распределенная база данных. Потому что при всех своих достоинствах, существует значимые недостатки, не позволяющие реализовать РБД. Например, параметр «Неизменяемость». С одной стороны это обеспечивает общедоступность и защиту от ПВГ. С другой стороны, сохраняется вся история операций. К примеру, вся цепочка блоков Эфириума «весит» 130Гб (и это за пару лет работы!). Рост объема блокчейна в ближайшем будущем грозит тем, что его обслуживание станет возможным только весьма состоятельным структурам, так как он просто не будет помещаться на жесткий диск. Это прямой риск централизации экосистемы.
Кроме этого, популярные приложения моментально столкнутся с другой проблемой – медленными транзакциями. Коль скоро начали сравнивать с Эфиром, то им и продолжим. Здесь скорость транзакций = 15 операций/секунду. Далее, понимая, что блокчейн сам по себе БД, однако хранилище достаточно примитивно – поиск осуществляется по открытому ключу, объем сберегаемой «инфы» ограничен. В общем, для серьезных приложений этого явно мало. Именно по этим причинам, в процессе разработок приложений на базе блокчейна, к примеру, все для того же Эфира, проблема хранения информации архиактуальна. Более того, по состоянию на текущий момент, даже удовлетворительных способов разрешения этой непростой задачи не существует.