„Вредности раздвојене зарезима (ЦСВ) су један од најсвестранијих формата података који се лако користе. То је лагани формат података који омогућава програмерима и апликацијама да преносе и анализирају податке са једног извора на други.
ЦСВ подаци чувају податке у табеларном формату где је свака колона одвојена зарезом, а нови запис се додељује новом реду. Ово га чини веома добрим избором за извоз база података као што су СКЛ базе података, Цассандра подаци и још много тога.
Стога није изненађење што ћете наићи на сценарио у којем морате да увезете ЦСВ датотеку у своју базу података.
Циљ овог водича је да вам покаже брз и једноставан метод увоза ЦСВ датотеке у ваш Еластицсеарцх кластер користећи Кибана контролну таблу.“
Хајде да ускочимо.
Захтеви
Пре роњења, уверите се да имате следеће захтеве:
- Еластицсеарцх кластер са зеленим здравственим статусом.
- Кибана сервер повезан са вашим Еластицсеарцх кластером.
- Довољне дозволе за управљање индексима на вашем кластеру.
Пример ЦСВ датотеке
Као и обично, први услов је ваша изворна ЦСВ датотека. Добро је осигурати да су подаци у вашој ЦСВ датотеци добро форматирани и да не садрже грешке.
У сврху илустрације, користићемо бесплатни скуп података који садржи филмове и ТВ емисије са Амазон Приме.
Отворите прегледач и идите до ресурса у наставку:
95594702АЦ22901330ЕФДБД490Д1Ф5Д853453030
Пратите процедуру да преузмете скуп података на вашу локалну машину. Преузету архиву можете извући командом:
$ распакујте а~ / Преузимања / арцхиве.зип
Увезите ЦСВ датотеку
Када будете спремни изворни фајл, можемо да наставимо и разговарамо о томе како да га увеземо.
Започните тако што ћете прећи на своју Кибана кућну контролну таблу и изабрати опцију „отпреми датотеку“.
Пронађите циљну ЦСВ датотеку коју желите да увезете у прозору покретача.
Изаберите изворну датотеку и кликните на отпремање.
Дозволите Еластицсеарцх-у и Кибани да анализирају отпремљени фајл. Ово ће рашчланити ЦСВ датотеку и одредити формат података, поља, типове података итд.
НАПОМЕНА: У зависности од ваше конфигурације кластера и величине података, овај процес може потрајати. Уверите се да главни чвор реагује да бисте избегли временско ограничење.
Када се процес заврши, требало би да добијете узорак садржаја ваше датотеке и статистику датотеке коју анализира Еластиц.
Можете да прилагодите бројне параметре, на пример, граничник, редове заглавља, итд. На пример, можемо да прилагодимо излаз изнад да кажемо Еластиц-у да наша ЦСВ датотека садржи датотеке заглавља.
Затим можемо да кликнемо на примени и поново анализирамо податке. Ово би требало да форматира податке у исправном формату, укључујући поља.
Затим можемо кликнути на увоз да бисмо наставили на увезену контролну таблу.
Овде треба да направимо индекс у коме се чувају ЦСВ подаци. Можете додијелити било које подржано име свом индексу.
Ако желите да прилагодите својства индекса, као што је број фрагмената, реплика, мапирања, итд. Изаберите напредну опцију и подесите своја подешавања како вам срце жели.
На крају, кликните на увоз и гледајте како Кибана чини своју „магију“. Када завршите, свом индексу можете приступити или преко Еластицсеарцх АПИ-ја или користити Кибана контролну таблу.
И готови сте!!
Закључак
У овом посту смо покрили процес преузимања и увоза вашег ЦСВ скупа података у ваш Еластицсеарцх кластер користећи Кибана контролну таблу.
Хвала на читању и срећно кодирање!!