Пандас Кцут

Pandas Kcut



„Питхон“ садржи много библиотека, а када желимо да анализирамо или манипулишемо подацима онда користимо ове „Питхон“ библиотеке, а „панде“ је такође библиотека. Библиотека „панде“ се користи у области науке о подацима, а такође се користи у активностима машинског учења. „пандас“ ДатаФраме нам помаже у чувању података. У „пандама“, када желимо спајање података, онда користимо метод „кцут()“. Метода „кцут()“ се користи за претварање континуалних карактеристика у категоричке. Можемо додати различите типове параметара у ову методу „кцут()“ за добијање различитих типова резултата. Овај водич се бави методом „кцут()“, а ми ћемо овде детаљно објаснити метод „кцут()“. Објаснићемо вам како вршимо сабирање података уз помоћ функције „кцут()“ у „пандас“ у овом водичу.“

Пример #01

Применићемо метод „кцут()“ у овим кодовима, а ове кодове ћемо урадити у апликацији „Спидер“. Када морамо да радимо са „пандама“, можемо приступити његовим функцијама само када увеземо библиотеку „панда“ у наше кодове. Прво стављамо „импорт“, а затим пишемо „панде као пд“. Сада морамо да применимо метод „кцут()“, тако да за ово овде креирамо ДатаФраме. Конструишемо „Рандом_дф“ који садржи „Р_ИД, Р_наме и Р_аге“ као своје колоне, а такође у „Р_ИД“ стављамо „Р_17, Р_21, Р_24, Р_29, Р_31, Р_34, Р_44, Р_46, Р_50, Р_51, Р_55, Р_61, Р_73 и Р_81”. Затим додајемо „Теодор, Теди, Ноа, Лео, Ајви, Хенри, Фреди, Евелин, Ава, Вилоу, Тео, Оскар, Џејкоб и Харпер“ у колону „Р_наме“. Након овога, у колону „Р_аге“ убацујемо „21, 33, 12, 43, 22, 7, 21, 51, 72, 19, 10, 9, 37 и 40“. Сада користимо „принт()“ који садржи „Рандом_дф“ и то ће помоћи у приказивању „Рандом_дф“ оквира података. Управо смо креирали ДатаФраме и још увек не примењујемо метод „кцут()“.








Икона „Покрени“ нам помаже у извршавању кодова. Када притиснемо ову икону „покрени“, резултат овог кода се приказује на терминалу апликације „Спидер“. „Рандом_дф“ ДатаФарме је приказан као резултат кода који смо написали у овом примеру. Сада ћемо применити метод „кцут()“ и такође ћемо показати његов резултат.




Овде сакупљамо податке. Биннинг колону „Р_аге“ и постављамо метод „пд.кцут()“, који је метод „панда“ који помаже у груписању података. У овој методи убацујемо име ДатаФраме-а и такође име колоне на коју желимо да применимо ову методу „кцут()“. Такође постављамо вредност „к” на „5” и користи се за сечење података колоне „Р_аге” на пет једнаких квантила. Додамо методу „кцут()“ у „принт()“, тако да ће такође приказати податке о биннингу на терминалу.




Овде се приказују подаци након биннинга и сече „Р_аге“ на пет квантила. Такође приказује категорије у којима су подаци из колоне „Р_аге“ биновани. Категоријска серија представља канте „Р_аге“.






Такође можемо прилагодити етикету за ове канте. Додамо ове ознаке за канте да бисмо их лакше тумачили. Додамо колону „Р_аге_кцут“ у „Рандом_дф“ у коју додајемо ознаке ових бинова. Поново користимо метод „пд.кцут()“ за њихово означавање. У њега додајемо ознаке које су „мало, не тако мало, осредње, високо и највише“. Затим поново стављамо „Рандом_дф“ у „принт()“.


Све канте су означене и представљене у овом исходу. Колона „Р_аге_кцут“ је приказана у овом ДатаФраме-у у којем су приказане означене корпе.



Пример #02

За креирање ДатаФраме-а, прво додајемо „оцене“, које су „3, 6, 8, 7, 2, 5, 1, 9, 4, 7 и 8“. Затим додајемо имена ученика у „ученици“, а то су „Петер, Бромли, Џејмс, Дејвид, савезници, Џон, Џејмс, Семјуел, Вилијам, Хауард и Александар“. Затим генеришемо „Градес_дф“ где смо додали метод „пд.ДатаФраме()“ и у ову методу стављамо „Стд_наме“, које ће се појавити као име колоне, и овоме додељујемо вредности „студентс“. Затим постављамо „Студентс_градес“ као име колоне ДатаФраме-а и такође додељујемо „оцене“ овде, које смо креирали изнад. Након овога, имамо „принт()“ у који додајемо „Градес_дф“ за штампање.


ДатаФраме који садржи две колоне је приказан у резултату овог кода. Сада ћемо применити методу „кцут()“ на колону „Студентс_градес“ за спајање података вредности ове колоне.


Овде додајемо нову колону „оцена“ у којој смо применили „пд.кцут()“ на колону „Студентс_градес“, а такође смо користили „4“ за вредност „к“, тако да ће се смањити податке у четири једнака квантила. После овога, овде специфицирамо ове квантиле тако што ћемо ставити вредности у „к“, које су „0, .4, .8 и 1“. Затим, приказујемо и ово. Сада означавамо ове састављене податке, а ознаке које додајемо овде су „Д, Ц, А и Б“ и такође се чувају у колони „оцена“.


Овде се подаци након биннинга приказују овде у колони „оцена“ и сече податке колоне „Студентс_градес“ на четири једнака квантила.


ДатаФраме који добијамо након примене методе „кцут()“ и навођења квантила приказан је у овом исходу.


Сада, након додавања налепница у ове корпе се такође приказују у овом исходу у колони „оцена“, и можете видети да додељује ознаке према вредностима корпе.

Пример #03

Такође можемо применити метод „кцут()“ на податке ЦСВ датотеке. За ово прво читамо податке ЦСВ датотеке уз помоћ методе „реад_цсв()“. Читамо податке датотеке “оффице2.цсв”, а затим се подаци ове датотеке стављају у “Оффице_дф”. Овај метод ће конвертовати податке датотеке „оффице2“ у ДатаФраме и сачувати их у „Оффице_дф“. Затим, такође приказујемо ове податке стављањем „Оффице_дф“ у „принт()“. Након овога, додајемо нову колону под називом „Јединице_кцут“, на коју примењујемо функцију „пд.кцут()“ на колону „Јединице“.

Поред тога, поставили смо вредност променљиве „к“ на „5“, што ће поделити податке у пет једнаких квантила. Подаци, након пресецања на 5 једнаких квантила, чувају се у колони „Унитс_кцут“, а ова колона се такође додаје у „Оффице_дф“, а „Оффице_дф“ се поново приказује овде помоћу „принт()“. Сада означавамо ове састављене податке, додајући ознаке у методи „кцут()“, а то су „Јединица 1, Јединица 2, Јединица 3, Јединица 4 и Јединица 5“ и такође их чувамо у колони „Ознаке“ . Такође приказујемо овај оквир података у који је додата колона „Ознаке“.


Подаци које добијамо након читања датотеке “оффице2.цсв” се овде приказују у облику ДатаФраме-а. Затим се додаје колона „Јединице_кцут“ у којој се приказују биниране вредности колоне „Јединице“. Након тога, додаје се и колона „Ознаке“, која додељује ознаке овим смештаним вредностима. Ово се све ради коришћењем методе „кцут()“ у „пандама“.

Закључак

Детаљно смо објаснили методу „кцут()“ у овом туторијалу који помаже у груписању података у „пандама“. Разговарали смо о томе да се подаци бинују у складу са квантилном вредношћу „к“ коју смо додали у методи „кцут()“, а такође смо прилагодили ознаке овим састављеним подацима. Истражили смо метод „кцут()“ и применили ову методу на колоне ДатаФраме-а, а такође смо применили ову „кцут()“ методу на податке ЦСВ датотеке након читања ЦСВ датотека. У овом водичу смо представили исход свих кодова да бисмо јасно објаснили и показали резултат методе „кцут()“.