Как да изберем правилната база данни NoSQL

Базите данни NoSQL осигуряват висока оперативна скорост и повишена гъвкавост за разработчиците на софтуер и други потребители в сравнение с традиционните таблични (или SQL) бази данни.

Структурите на данни, използвани от базите данни NoSQL - ключ-стойност, широка колона, графика или документ - се различават от тези, използвани от релационните бази данни. В резултат на това базите данни NoSQL. Базите данни NoSQL могат да се мащабират на хиляди сървъри, макар и понякога със загуба на последователност на данните. Но това, което прави базите данни NoSQL особено актуални днес, е, че те са особено подходящи за работа с големи набори от разпределени данни, което ги прави добър избор за проекти за големи данни и анализи.

Как да изберем база данни NoSQL: Ключови фактори

С повече от две дузини бази данни с отворен код и комерсиални NoSQL на пазара, как да изберете правилния продукт или облачна услуга?

Един жизненоважен фактор е да знаете целта, за която искате да предоставите данните, казва Карл Олофсън, вицепрезидент на IDC за изследвания.

Базите данни NoSQL се различават по архитектура и функции, така че трябва да изберете типа, който е най-подходящ за желаната задача:

  • Като цяло хранилищата ключ-стойност са най-добри за постоянното споделяне на данни от множество процеси или микроуслуги в приложение.
  • Ако планирате да направите задълбочен анализ на връзката за изчисляване на близост, откриване на измами или оценка на асоциативна структура, базата данни с графики може да е по-добрият избор.
  • Ако трябва да събирате данни много бързо и при големи обеми за анализ, погледнете в широко хранилище на колони. Такива бази данни NoSQL също предлагат поддръжка на документи и графики.

Не предполагайте, че първоначалният ви проект е единственият модел за използване, който ще приложите към базата данни. Може да започнете просто да правите управление на данни за състоянието или сесията, след това да направите обработка на транзакции и все пак по-късно да направите някои анализи.

В близко бъдеще акцентът трябва да бъде върху производителността, мащаба, сигурността, поддръжката на различни натоварвания (включително транзакционни, оперативни и аналитични), интеграция със съществуващи екосистеми, административни усилия, поддръжка в облак и поддържани случаи на използване, казва Ноел Юхана, главен анализатор във Forrester Research. От тях сигурността е от решаващо значение. На базите данни NoSQL, които имат сертификати за сигурност, трябва да се обърне по-голямо внимание. Потърсете функции като криптиране както на данни в покой, така и на данни в движение, за да защитите чувствителната информация.

Също така, не всички бази данни NoSQL могат да се мащабират добре, казва Юхана, така че не приемайте за даденост, че само защото продуктът е в категорията NoSQL, той ще се мащабира и ще се представя по-добре от релационните бази данни.

NoSQL предлага различни нива на последователност в модела за мащабиране, така че разгледайте решения, които отговарят на вашите специфични изисквания. Например, ако искате да поддържате силно критични банкови транзакции, релационните бази данни все още са най-доброто решение.

Базите данни NoSQL, които трябва да имате предвид

Ето базите данни NoSQL, които трябва да имате предвид.

MongoDB

MongoDB е най-популярната база данни NoSQL. Безплатна и с отворен код, междуплатформена, ориентирана към документи база данни, MongoDB използва JSON-подобни документи със схеми. Платформата се поддържа от MongoDB Inc. и се публикува под комбинация от Gnu Affero General Public License и Apache License.

MongoDB Atlas включва най-добрите оперативни практики, които компанията е научила от оптимизирането на хиляди внедрявания в организации от всякакъв мащаб. Облачното базирано предложение се занимава с управление, настройка и конфигуриране на база данни, софтуерно коригиране, мониторинг и архивиране и работи като разпределен клъстер на бази данни.

преглежда базите данни NoSQL

Прочетете нашите задълбочени прегледи на ключови бази данни NoSQL

  • MongoDB
  • Атлас на MongoDB
  • Лежанка
  • Cosmos DB
  • Neo4j
  • Google Bigtable
  • База данни MarkLogic NoSQL
  • Aerospike
  • Сравнение: MongDB срещу Couchbase Server

И прочетете нашите ръководства за специфични технологии за бази данни NoSQL:

  • Бази данни NoSQL с ключ-стойност (Aerospike, Cosmos DB, Hazelcast, Memcached и Redis)
  • Документирайте NoSQL бази данни (Cloudant, Cosmos DB, Couchbase, CouchDB, DynamoDB и Firebase)

Основните функции и възможности включват напълно управлявано архивиране, непрекъснато архивиране, възстановяване на място в момента, моментни снимки, които могат да се изискат, автоматично генерирани диаграми, панел за изпълнение в реално време и персонализиращо се предупреждение. Потребителите могат да импортират данни на живо в MongoDB Atlas с минимално въздействие върху приложенията, използвайки вградената услуга за миграция на живо.

Базата данни е оптимална за съхранение, обработка и достъп до документи и други видове набори от данни и е популярна сред разработчиците, тъй като е лесна за използване, мащабира се да отговаря на взискателните приложения и предлага изчерпателна екосистема от инструменти и партньори, казва Юхана . Често използваните случаи за MongoDB включват персонализация, анализ в реално време, интернет на нещата (IoT), големи данни, каталози на продукти / активи, откриване на сигурност и измами, мобилни приложения, центрове за данни, управление на съдържанието и приложения за социално сътрудничество и сътрудничество.

Amazon DynamoDB

Amazon DynamoDB е друга популярна базирана на облак база данни NoSQL. Amazon DynamoDB е напълно управлявана NoSQL платформа, която използва SSD устройство за съхранение, обработка и достъп до данни, за да поддържа приложения с висока производителност и мащаб.

Той автоматично разбива данни между сървъри въз основа на изискванията за пропускателна способност и съхранение на работното натоварване и обработва по-големи случаи на високоефективна употреба.

Потребителите могат да мащабират, наблюдават и управляват своите таблици както чрез интерфейси за приложно програмиране (API), така и през конзолата за управление на уеб услуги на Amazon. DynamoDB е тясно интегриран с Amazon EMR (управлявана рамка за Apache Hadoop, Apache Spark и HBase), която предлага възможност за изпълнение на заявки, които обхващат множество източници на данни.

Платформата поддържа както модели ключ-стойност, така и документи, а също така има библиотека за геопространствено индексиране. Организациите използват DynamoDB, за да поддържат различни случаи на употреба, включително рекламни кампании, приложения в социалните медии, проследяване на информация за игрите, събиране и анализ на данни от сензори и регистрационни файлове и електронна търговия.

DataStax и DataStax Enterprise Platform

DataStax използва Apache Cassandra за разпространение в центрове за данни. Силен плюс за DataStax NoSQL е неговата глобална разпределена архитектура, казва Yuhanna от Forrester. DataStax разпространява, допринася и поддържа търговската корпоративна версия на Apache Cassandra, проект с отворен код. Cassandra е магазин с широки редове, разпределена база данни ключ-стойност, базирана на Google Bigtable.

Сред основните му характеристики са толерантността към грешки, мащабираната архитектура, достъпът до данни с ниска латентност и опростеното администриране. DataStax предоставя допълнителни функции като анализи, търсене, наблюдение, в паметта и сигурност за поддръжка на критични приложения.

DataStax Enterprise поддържа различни видове бизнес приложения, включително транзакционни, аналитични, прогнозни анализи и смесени работни натоварвания. Той предлага по-широки възможности за много модели с поддръжка на графични и JSON данни. Най-популярните случаи включват откриване на измами, продуктови каталози, персонализация на потребителите, механизми за препоръки и IoT.

Лежанка

Couchbase е платформа за база данни за поддръжка на документи JSON, разпространявана от Couchbase Inc. СУБД NoSQL с отворен код поддържа случаи на широко използване.

Couchbase Server, база данни с ключ-стойност и документи с отворен код NoSQL и вграден кеш, привлича предприятия, които се нуждаят от база данни, която може да осигури производителност, мулти-модел, мащаб и автоматизация, казва Юхана.

Организациите използват Couchbase за поддръжка на социални и мобилни приложения, магазини за съдържание и метаданни, транзакции за електронна търговия и приложения за онлайн игри. Couchbase осигурява пълна поддръжка на документи, гъвкав модел на данни, индексиране, пълнотекстово търсене и MapReduce за анализ в реално време.

Платформата се използва от големи предприятия за поддържане на различни критични натоварвания, включително оперативни и аналитични процеси.

Redis Enterprise

Спонсорирана от Redis Labs, платформата с отворен код Redis Enterprise е една от най-често срещаните бази данни NSQ с ключови стойности, казва Olofson от IDC. (Научете повече за използването на Redis за измерване в реално време, управление на контрола на достъпа и оформяне на трафика WebSockets.)

Redis предлага високоефективна база данни в паметта, която поддържа както спокойна, така и силна последователност, гъвкав модел без схема, висока наличност и лекота на внедряване, казва Yuhanna от Forrester.

Redis Labs разработи допълнителни функции и технология, която капсулира софтуера с отворен код и осигурява подобрена архитектура за внедряване на Redis, като същевременно поддържа API с отворен код.

Моделът за данни поддържа ключ-стойност; разнообразие от структури от данни като списъци, набори, растерни изображения и хешове; и редица модели чрез свързващи модули като търсене, графика, JSON и XML. Redis поддържа различни случаи на използване, включително анализи в реално време, транзакции, поглъщане на данни, социални медии, управление на работата, опашки за съобщения и кеширане.

MarkLogic

MarkLogic NoSQL база данни е оперативна и транзакционна корпоративна база данни, предназначена за скорост и мащаб на NoSQL. Използвайки мултимоделен подход, базата данни осигурява интегриране и съхраняване на критични данни, след което ви позволява да разглеждате тези данни като документи, като графика или като релационни данни - независимо дали са локални, виртуализирани или в облака. 

Той осигурява висока наличност и функции за сигурност на ниво данни, включително съответствие с ACID, защита на ниво елемент, анонимизация, редакция и разширено криптиране. Поради тези причини е подходящ за предприятия, които искат да споделят огромни количества чувствителна информация. MarkLogic е и единствената база данни NoSQL със сертификат за общи критерии.

Други ключови функции целят подобряване на потребителското изживяване чрез създаване на единна, унифицирана представа за данни, които могат да се търсят и могат да бъдат проверени по всяко време с помощта на метаданни. Тези функции включват bitemporal, семантика, възможност за поглъщане както на структурирани, така и на неструктурирани данни (собствено хранилище за JSON, XML, RDF, геопространствени и големи двоични файлове) и универсален индекс „попитай всичко“.

Оперативен център за данни, който помага за справяне с управлението и корпоративното съответствие, прави MarkLogic полезен за големи предприятия със силози за данни, както и за тези, които са изправени пред регулации и повишени заплахи за киберсигурността.

Други опции за NoSQL

Други предложения с отворен код и комерсиални предложения за бази данни NoSQL включват:

  • Blazegraph, от Systap
  • Google Bigtable, от Google
  • Хелий, от Levyx
  • Microsoft Azure Cosmos DB, от Microsoft
  • Neo4j, от Neo4j
  • База данни на Oracle NoSQL от Oracle
  • ThingSpan, от Обективност