°³¶ËÀ̳׿¡¼ ÆÇ¸ÅµÈ "Pandas Cookbook 2/e" Á¤°¡ 45,000¿ø Æò±ÕÇÒÀΰ¡
|
|
|
1Àå. pandas ±âÃÊ
__pandas ÀÓÆ÷Æ® __¼Ò°³ __pandas DataFrame __DataFrame ¼Ó¼º __µ¥ÀÌÅÍ Çü½Ä ÀÌÇØ __¿ ¼±Åà __Series ¸Þ¼µå È£Ãâ __Series ¿¬»ê __Series ¸Þ¼µå üÀÎ __¿ À̸§ º¯°æ __¿ÀÇ »ý¼º°ú »èÁ¦
2Àå. ±âº» DataFrame ¿¬»ê
__¼Ò°³ __¿©·¯ DataFrame ¿ ¼±Åà __¸Þ¼µå¸¦ »ç¿ëÇØ ¿ ¼±Åà __¿ À̸§ Á¤·Ä __DataFrame ¿ä¾à __DataFrame ¸Þ¼µå üÀÎ __DataFrame ¿¬»ê __°áÃøÄ¡ ºñ±³ __DataFrame ¿¬»ê ¹æÇâ Àüȯ __´ëÇÐ ÀÎÁ¾ ´Ù¾ç¼º Áö¼ö °áÁ¤
3Àå. DataFrame »ý¼º°ú À¯Áö
__¼Ò°³ __½ºÅ©·¡Ä¡¿¡¼ DataFrame »ý¼º __CSV ÀÛ¼º __´ëÇü CSV ÆÄÀÏ Àбâ __¿¢¼¿ ÆÄÀÏ »ç¿ë __ZIP ÆÄÀÏ·Î ÀÛ¾÷ __µ¥ÀÌÅͺ£À̽º¿Í ÀÛ¾÷ __JSON ÆÄÀÏ Àбâ __HTML Å×À̺í Àбâ
4Àå. µ¥ÀÌÅÍ ºÐ¼® ½ÃÀÛ
__¼Ò°³ __µ¥ÀÌÅÍ ºÐ¼® ·çƾ °³¹ß __µ¥ÀÌÅÍ µñ¼Å³Ê¸® __µ¥ÀÌÅÍ Çü½Ä º¯°æÀ¸·Î ¸Þ¸ð¸® Àý¾à __ÃÖ´ë Áß¿¡ ÃÖ¼Ò ¼±Åà __Á¤·ÄÇØ °¢ ±×·ì¿¡¼ °¡Àå Å« Ç׸ñ ¼±Åà __sort_values¸¦ »ç¿ëÇØ nlargest º¹Á¦ __ÃßÀû ÁöÁ¤°¡ ÁÖ¹® °¡°Ý °è»ê
5Àå. Ž»öÀû µ¥ÀÌÅÍ ºÐ¼®
__¼Ò°³ __¿ä¾à Åë°è·® __¿ Çü½Ä __¿¹Á¦ ±¸Çö __¹üÁÖÇü µ¥ÀÌÅÍ __¿¬¼Ó µ¥ÀÌÅÍ __¹üÁÖ °£ÀÇ ¿¬¼Ó °ª ºñ±³ __µÎ °³ÀÇ ¿¬¼Ó ¿ ºñ±³ __¹üÁÖ °ª°ú ¹üÁÖ °ª ºñ±³ __pandas ÇÁ·ÎÆÄÀϸµ ¶óÀ̺귯¸® »ç¿ë
6Àå. µ¥ÀÌÅÍÀÇ ºÎºÐÁýÇÕ ¼±ÅÃ
__¼Ò°³ __Series µ¥ÀÌÅÍ ¼±Åà __DataFrame Çà ¼±Åà __DataFrame Çà°ú ¿À» µ¿½Ã¿¡ ¼±Åà __Á¤¼ö¿Í ·¹ÀÌºí ¸ðµÎ·Î µ¥ÀÌÅÍ ¼±Åà __»çÀü½ÄÀ¸·Î ½½¶óÀ̽Ì
7Àå. Çà ÇÊÅ͸µ
__¼Ò°³ __ºÒ¸®¾ð Åë°è·® °è»ê __´ÙÁß ºÒ¸®¾ð Á¶°Ç ±¸¼º __ºÒ¸®¾ð ¹è¿À» »ç¿ëÇÑ ÇÊÅ͸µ __Çà ÇÊÅ͸µ°ú À妽º ÇÊÅ͸µ ºñ±³ __À¯ÀÏÇÏ°í Á¤·ÄµÈ À妽º¸¦ »ç¿ëÇÑ ¼±Åà __SQL WHERE Àý Çؼ® __Äõ¸® ¸Þ¼µå¸¦ »ç¿ëÇÑ ºÒ¸®¾ð À妽ÌÀÇ °¡µ¶¼º Çâ»ó __.where ¸Þ¼µå¸¦ »ç¿ëÇØ Series Å©±â À¯Áö __DataFrame Çà ¸¶½ºÅ· __ºÒ¸®¾ð, Á¤¼ö À§Ä¡, ·¹À̺íÀ» »ç¿ëÇØ ¼±ÅÃ
8Àå. À妽º Á¤·Ä
__¼Ò°³ __À妽º °´Ã¼ °Ë»ç __µ¥Ä«¸£Æ® °ö »ý¼º __À妽º Æø¹ß __µ¿ÀÏÇÏÁö ¾ÊÀº À妽º·Î °ª ä¿ì±â __´Ù¸¥ DataFrameÀÇ ¿ ´õÇϱâ __°¢ ¿ÀÇ ÃÖ´ñ°ª °Á¶ __¸Þ¼µå üÀÎÀ¸·Î idxmax º¹Á¦ __¿¿¡¼ ÃÖ´ë °øÅë ÃÖ´ñ°ª ã±â
9Àå. ±×·ìȸ¦ À§ÇÑ Áý°è, ¿©°ú, º¯È¯
__¼Ò°³ __Áý°è Á¤ÀÇ __º¹¼ö ¿°ú ÇÔ¼ö¸¦ »ç¿ëÇÑ ±×·ìÈ¿Í Áý°è __±×·ìÈ ÈÄ ´ÙÁß À妽º Á¦°Å __»ç¿ëÀÚ Á¤ÀÇ Áý°è ÇÔ¼ö¸¦ »ç¿ëÇÑ ±×·ìÈ __*args¿Í **kwargs¸¦ »ç¿ëÇÑ Áý°è ÇÔ¼ö »ç¿ëÀÚ Á¤ÀÇ __groupby °´Ã¼ °Ë»ç __¼Ò¼ö ÀÎÁ¾ÀÌ °ú¹ÝÀÎ ÁÖ¸¦ ÇÊÅ͸µ __üÁß °¨·® ³»±â¸¦ ÅëÇÑ º¯½Å __apply¸¦ »ç¿ëÇØ ÁÖº° °¡Áß Æò±Õ SAT Á¡¼ö °è»ê __¿¬¼Ó º¯¼ö¸¦ ±âÁØÀ¸·Î ±×·ìÈ __µµ½Ã °£ ÃÑ ºñÇà Ƚ¼ö °è»ê __°¡Àå ±ä ¿¬¼Ó Á¤½Ã ºñÇà ã±â
10Àå. Á¤µ·µÈ Çü½ÄÀ¸·Î µ¥ÀÌÅÍ À籸¼º
__¼Ò°³ __½ºÅÃÀ» »ç¿ëÇØ º¯¼ö °ªÀ» ¿ À̸§À¸·Î Á¤µ· __melt¸¦ »ç¿ëÇØ º¯¼ö °ªÀ» ¿ À̸§À¸·Î Á¤µ· __¿©·¯ º¯¼öÀÇ ±×·ìÀ» µ¿½Ã¿¡ ½ºÅà __½ºÅÃµÈ µ¥ÀÌÅÍ µÇµ¹¸®±â __groupby Áý°è ÈÄ ¾ð½ºÅà __groupby Áý°è·Î pivot_table º¹Á¦ __¼Õ½¬¿î À籸¼ºÀ» À§ÇÑ Ãà ·¹º§ À̸§ º¯°æ __¿©·¯ º¯¼ö°¡ ¿ À̸§À¸·Î ÀúÀåµÉ ¶§ÀÇ Á¤µ· __¿©·¯ º¯¼ö°¡ ´ÜÀÏ ¿·Î ÀúÀåµÉ ¶§ Á¤µ· __µÑ ÀÌ»óÀÇ °ªÀÌ µ¿ÀÏ ¼¿¿¡ ÀúÀåµÉ ¶§ÀÇ Á¤µ· __º¯¼ö°¡ ¿ À̸§°ú °ªÀ¸·Î ÀúÀåµÆÀ» ¶§ÀÇ µ¥ÀÌÅÍ Á¤µ·
11Àå. pandas °´Ã¼ º´ÇÕ
__¼Ò°³ __DataFrame¿¡ »õ Çà Ãß°¡ __¿©·¯ DataFrameÀ» ÇÔ²² ¿¬°á __concat, join, mergeÀÇ Â÷ÀÌÁ¡ ÀÌÇØ __SQL µ¥ÀÌÅͺ£À̽º¿¡ ¿¬°á
12Àå. ½Ã°è¿ ºÐ¼®
__¼Ò°³ __ÆÄÀ̽ã°ú pandas ³¯Â¥ µµ±¸ÀÇ Â÷ÀÌÁ¡ ÀÌÇØ __½Ã°è¿À» Áö´ÉÀûÀ¸·Î ½½¶óÀ̽º __½Ã°£ µ¥ÀÌÅÍ·Î ¿ ÇÊÅ͸µ __DatetimeIndex¿¡¼¸¸ ÀÛµ¿ÇÏ´Â ¸Þ¼µå »ç¿ë __ÁÖ°£ ¹üÁË ¼ö °è»ê __ÁÖ°£ ¹üÁË¿Í ±³Åë»ç°í¸¦ º°µµ·Î Áý°è __ÁÖº°, ¿¬µµº° ¹üÁË ÃøÁ¤ __timeIndex¸¦ »ç¿ëÇØ À͸í ÇÔ¼ö·Î ±×·ìÈ __Timestamp¿Í ´Ù¸¥ ¿À» ±âÁØÀ¸·Î ±×·ìÈ
13Àå. matplotlib, pandas, seabornÀ» ÀÌ¿ëÇÑ ½Ã°¢È
__¼Ò°³ __matplotlib·Î ½ÃÀÛ __matplotlib¿¡ ´ëÇÑ °´Ã¼ÁöÇâ °¡À̵å __matplotlib·Î µ¥ÀÌÅÍ ½Ã°¢È __pandas¸¦ »ç¿ëÇÑ ±âº» µµ½ÄÈ __flights µ¥ÀÌÅͼ ½Ã°¢È __»õ·Î¿î °æÇâÀ» ¹ß°ßÇϱâ À§ÇÑ ´©Àû ¿µ¿ª Â÷Æ® __seaborn°ú pandasÀÇ Â÷ÀÌÁ¡ __seaborn ±×¸®µå¸¦ »ç¿ëÇÑ ´Ùº¯·® ºÐ¼® __seabornÀ¸·Î diamonds µ¥ÀÌÅͼÂÀÇ ½É½¼ ¿ª¼³ ¹ß°ß
14Àå. pandas µð¹ö±ë°ú Å×½ºÆ®
__µ¥ÀÌÅ͸¦ º¯È¯ÇÏ´Â ÄÚµå __Apply ¼º´É __Dask, Pandarell, Swifter µîÀ¸·Î apply ¼º´É Çâ»ó __ÄÚµå °Ë»ç __Jupyter¿¡¼ÀÇ µð¹ö±ë __Great Expectations¸¦ ÀÌ¿ëÇÑ µ¥ÀÌÅÍ ¹«°á¼º °ü¸® __pandas¿Í ÇÔ²² pytest »ç¿ë __Hypothesis¸¦ »ç¿ëÇØ Å×½ºÆ® »ý¼º
¡Ú ÀÌ Ã¥¿¡¼ ´Ù·ç´Â ³»¿ë ¡Ú
¡á ¸ðµç µ¥ÀÌÅͼÂÀ» Ž»öÇÒ ¼ö ÀÖ°Ô ÇØÁÖ´Â pandasÀÇ ±âº» Áö½Ä ¡á Äõ¸®¿Í ¼±ÅÃÀ¸·Î µ¥ÀÌÅÍ Áß ¿øÇÏ´Â ºÎºÐ¸¸ ºÎºÐÁýÇÕÀ¸·Î ÀûÀýÈ÷ °ñ¶ó³»´Â ¹æ¹ý ¡á µ¥ÀÌÅ͸¦ Á¾ÇÕÇϰųª °¢ ±×·ìÀ¸·Î º¯È¯Çϱâ Àü °³º° ±×·ìÀ¸·Î ºÐÇÒÇÏ´Â ¹æ¹ý ¡á µ¥ÀÌÅÍ ºÐ¼®°ú ½Ã°¢È°¡ ¿ëÀÌÇϵµ·Ï µ¥ÀÌÅ͸¦ Á¤µ·µÈ Çü½ÄÀ¸·Î À籸¼ºÇÏ±â ¡á º¹ÀâÇÑ ½ÇÁ¦ ȯ°æ µ¥ÀÌÅ͸¦ ¸Ó½Å·¯´×¿¡¼ »ç¿ëÇÒ ¼ö ÀÖµµ·Ï ÁغñÇϱ⠡á pandasÀÇ SQL À¯»ç ¿¬»ê ±â´ÉÀ¸·Î ¼·Î ´Ù¸¥ ¼Ò½ºÀÇ µ¥ÀÌÅÍ º´ÇÕÇϱ⠡á pandasÀÇ µ¶º¸ÀûÀÎ ½Ã°è¿ µ¥ÀÌÅÍ Ã³¸® ´É·Â ¡á pandasÀÇ matplitlib³ª seabornÀ» »ç¿ëÇÑ ½Ã°¢È ±â´É
¡Ú ÀÌ Ã¥ÀÇ ´ë»ó µ¶ÀÚ ¡Ú
´Ü¼øÇÑ ¿¹Á¦¿¡¼ °í±Þ ¿¹Á¦±îÁö °ÅÀÇ 100°¡Áö ¿¹Á¦¸¦ ´Ù·é´Ù. ¸ðµç ¿¹Á¦´Â °£´Ü¸í·áÇÏ°í ÃֽŠÆÄÀ̽㠹®¹ý°ú ±¸¹®À» »ç¿ëÇØ ÀÛ¼ºÇß´Ù. 'ÀÛµ¿ ¿ø¸®' Àý¿¡¼´Â ¿¹Á¦ÀÇ º¹ÀâÇÑ °¢ ´Ü°è¸¦ »ó¼¼È÷ ¼³¸íÇϸç, Á¾Á¾ 'Ãß°¡ »çÇ×' Àý¿¡¼ »õ·Î¿î ¿¹Á¦¿¡ ´ëÇÑ Á¤º¸¸¦ ¾òÀ» ¼ö ÀÖ´Ù. óÀ½ 6°³ ÀåÀÇ ¿¹Á¦´Â °£´ÜÇÑ ¿¹Á¦·Î ±¸¼ºµÆÀ¸¸ç, ÀÌÈÄ 5°³ Àå¿¡ ºñÇØ ±âº»ÀûÀÌ°í ±Ùº»ÀûÀÎ pandas ¿¬»ê¿¡ ÁßÁ¡À» µÐ´Ù. ³ª¸ÓÁö 5°³ ÀåÀº °í±Þ ¿¬»ê°ú ÇÁ·ÎÁ§Æ® ¼º°ÝÀÌ °ÇÑ ¿¹Á¦¸¦ ¼Ò°³ÇÑ´Ù. ³À̵µ°¡ ±¤¹üÀ§ÇϹǷΠÃʺ¸ÀÚ³ª ¼÷·ÃÀÚ ¸ðµÎ¿¡°Ô À¯¿ëÇÏ´Ù. ³» °æÇè¿¡ ºñÃç ºÃÀ» ¶§ pandas¸¦ ÀÏ»óÀûÀ¸·Î »ç¿ëÇÏ´Â »ç¶÷µµ pandasÀÇ °ü¿ë±¸¿¡ Àͼ÷ÇÏÁö ¾Ê´Ù¸é ¸¶½ºÅÍÇÏÁö ¸øÇÒ °ÍÀÌ´Ù. ÀÌ´Â pandas°¡ ¹æ´ëÇÑ ¿µ¿ªÀ» ´Ù·ç±â ¶§¹®ÀÌ´Ù. ´ëºÎºÐ µ¿ÀÏÇÑ ¿¬»êÀ» ¼öÇàÇÒ ¼ö ÀÖ´Â ¹æ¹ýÀº ¿©·¯ °¡Áö°¡ Àֱ⠶§¹®¿¡ »ç¿ëÀÚ´Â ¿øÇÏ´Â °á°ú¸¦ ¾ò°íÀÚ ºñÈ¿À²ÀûÀÎ ¹æ¹ýÀ» »ç¿ëÇÏ°í ÀÖÀ» ¼öµµ ÀÖ´Ù. µ¿ÀÏÇÑ ¹®Á¦¸¦ ÇØ°áÇÏ´Â pandas ¼Ö·ç¼ÇÀÇ ¼Óµµ Â÷ÀÌ°¡ ¼ö½Ê ¹è ÀÌ»ó ´Ù¸¥ °æ¿ìµµ ºó¹øÇÏ´Ù. Çʼö Áö½ÄÀº ¿ÀÁ÷ ÆÄÀ̽ã»ÓÀÌ´Ù. µ¶ÀÚ°¡ ¸®½ºÆ®(list), ÁýÇÕ(set), µñ¼Å³Ê¸®(dictionary), Æ©ÇÃ(tuple) µîÀÇ ÆÄÀ̽㠳»Àå µ¥ÀÌÅÍ ÀúÀå¼Ò¿¡ ¾î´À Á¤µµ Àͼ÷ÇÏ´Ù°í °¡Á¤ÇÑ´Ù.
¡Ú ÀÌ Ã¥ÀÇ ±¸¼º ¡Ú
1Àå, 'pandas ±âÃÊ'¿¡¼´Â pandas µ¥ÀÌÅÍ ±¸Á¶¸¦ ÀÌ·ç´Â µÎ ±¸¼º ¿ä¼ÒÀÎ Series¿Í DataFrameÀ» ÇغÎÇÏ°í ¿ë¾î¸¦ Á¤¸®ÇÑ´Ù. °¢ ¿Àº µ¿ÀÏÇÑ µ¥ÀÌÅÍ Çü½ÄÀ» °¡Á®¾ß ÇÏ°í ¿ì¸®´Â °¢ µ¥ÀÌÅÍ Çü½ÄÀ» ¾Ë¾Æº»´Ù. À̸¦ ÅëÇØ Series¿Í DataFrameÀÇ ¸Þ¼µå¸¦ È£ÃâÇÏ°í ¹Ù²Ù¸é¼ µÎ ¿ä¼ÒÀÇ ÁøÁ¤ÇÑ ÈûÀ» ¹è¿ï ¼ö ÀÖ´Ù. 2Àå, '±âº» DataFrame ¿¬»ê'¿¡¼´Â µ¥ÀÌÅÍ ºÐ¼®À» À§ÇØ °¡Àå Áß¿äÇÏ°í º¸ÆíÀûÀÎ ¿¬»êÀ» ¾Ë¾Æº»´Ù. 3Àå, 'DataFrame »ý¼º°ú À¯Áö'¿¡¼´Â DataFrameÀ» »ý¼ºÇÏ°í °ªÀ» ³Ö´Â ´Ù¾çÇÑ ¹æ¹ýÀ» ¾Ë¾Æº»´Ù. 4Àå, 'µ¥ÀÌÅÍ ºÐ¼® ½ÃÀÛ'¿¡¼´Â µ¥ÀÌÅ͸¦ ÀÐ¾î µéÀÎ ÈÄ, ÇØ¾ß ÇÒ ¹Ýº¹ ÀÛ¾÷¿¡ µµ¿òÀÌ µÇ´Â ³»¿ëÀ» ´Ù·é´Ù. 5Àå, 'Ž»öÀû µ¥ÀÌÅÍ ºÐ¼®'¿¡¼´Â ¼öÄ¡¿Í ¹üÁÖ µ¥ÀÌÅ͸¦ ºñ±³ÇÏ´Â ±âº» ºÐ¼® ±â¹ýÀ» ´Ù·é´Ù. ¶ÇÇÑ ÀϹÝÀûÀÎ ½Ã°¢È ±â¹ýµµ ¾Ë¾Æº»´Ù. 6Àå, 'µ¥ÀÌÅÍÀÇ ºÎºÐÁýÇÕ ¼±ÅÃ'¿¡¼´Â ¼·Î ´Ù¸¥ ºÎºÐÁýÇÕ ¼±Åÿ¡¼ ´Ù¾çÇÏ°í È¥µ¿µÇ´Â ºÎºÐ µî ¿©·¯ ÁÖÁ¦¸¦ ´Ù·é´Ù. 7Àå, 'Çà ÇÊÅ͸µ'¿¡¼´Â ºÒ¸®¾ð Á¶°ÇÀ» ÀÌ¿ëÇØ µ¥ÀÌÅÍÀÇ ºÎºÐÁýÇÕÀ» ¼±ÅÃÇÏ´Â Äõ¸® ÇÁ·Î¼¼½º¸¦ ´Ù·é´Ù. 8Àå, 'À妽º Á¤·Ä'¿¡¼´Â »ó´çÈ÷ Áß¿äÇϸ鼵µ Á¾Á¾ À߸ø ÀÌÇØÇÏ°í ÀÖ´Â À妽º °´Ã¼¸¦ ´Ù·é´Ù. À妽º¸¦ À߸ø ´Ù·ç¸é ¸¹Àº À߸øµÈ °á°ú¸¦ ÃÊ·¡ÇÑ´Ù. ¿¹Á¦¿¡¼ °·ÂÇÑ °á°ú¸¦ ¾òÀ» ¼ö ÀÖ´Â ¿Ã¹Ù¸¥ »ç¿ë¹ýÀ» ¾Ë¾Æº»´Ù. 9Àå, '±×·ìȸ¦ À§ÇÑ Áý°è, ¿©°ú, º¯È¯'¿¡¼´Â µ¥ÀÌÅÍ ºÐ¼®¿¡ ÇÊ¿äÇÑ °·ÂÇÑ ±×·ìÈ ±â´ÉÀ» ´Ù·é´Ù. µû¶ó¼ ¸ñÀû¿¡ ¸Â´Â ±×·ì¿¡ Àû¿ëÇÒ »ç¿ëÀÚ Á¤ÀÇ ÇÔ¼ö¸¦ ±¸¼ºÇÒ ¼ö ÀÖ´Ù. 10Àå, 'Á¤µ·µÈ Çü½ÄÀ¸·Î µ¥ÀÌÅÍ À籸¼º'¿¡¼´Â Á¤µ·µÈ µ¥ÀÌÅ͸¦ ¼³¸íÇÏ°í Áß¿äÇÑ ÀÌÀ¯¸¦ ¾Ë¾Æº¸°í ¼·Î ´Ù¸¥ ÇüÅÂÀÇ µ¥ÀÌÅ͸¦ Á¤µ·ÇÏ´Â ¹æ¹ýÀ» ´Ù·é´Ù. 11Àå, 'pandas °´Ã¼ º´ÇÕ'¿¡¼´Â DataFrame°ú Series¸¦ ¼öÁ÷°ú ¼öÆòÀ¸·Î º´ÇÕÇÏ´Â ¿©·¯ ¸Þ¼µå¸¦ ¾Ë¾Æº»´Ù. ¶ÇÇÑ À¥ ½ºÅ©·¡ÇÎÀ¸·Î Æ®·³ÇÁ¿Í ¿À¹Ù¸¶ ´ëÅë·ÉÀÇ ±¹Á¤ ¼öÇà Æò°¡ Á¡¼ö¸¦ ºñ±³ÇÏ°í À¥ ½ºÅ©·¡Çΰú SQL °ü°èÇü µ¥ÀÌÅͺ£À̽º ¿¬°áÀ» ½Ç½ÀÇغ»´Ù. 12Àå, '½Ã°è¿ ºÐ¼®'¿¡¼´Â °¡´ÉÇÑ ¸ðµç ½Ã°£ Â÷¿ø¿¡ µû¶ó ºÐÇØÇÒ ¼ö ÀÖ´Â ½Ã°è¿ÀÇ °·ÂÇÑ °í±Þ ±â´ÉÀ» ¾Ë¾Æº»´Ù. 13Àå, 'matplotlib, pandas, seabornÀ» ÀÌ¿ëÇÑ ½Ã°¢È'¿¡¼´Â pandas¿¡¼ ¸ðµç µµ½ÄÈÀÇ ±âº»ÀÌ µÇ´Â matplotlib ¶óÀ̺귯¸®¸¦ ¼Ò°³ÇÑ´Ù. ±×¸®°í pandas plot ¸Þ¼µå¿Í seaborn ¶óÀ̺귯¸® µî pandas¿¡¼ Á÷Á¢ Á¦°øÇÏÁö ¾Ê´Â ´Ù¾çÇÏ°í ½É¹ÌÀûÀÎ ½Ã°¢È ±â´ÉÀ» ¾Ë¾Æº»´Ù. 14Àå, 'pandas µð¹ö±ë°ú Å×½ºÆ®'¿¡¼´Â DataFrame°ú pandas Äڵ带 Å×½ºÆ®ÇÏ´Â ¸ÞÄ¿´ÏÁòÀ» »ìÆ캻´Ù. »ý»ê ¶óÀο¡ pandas¸¦ ¹èÆ÷ÇÒ °èȹÀ̶ó¸é ÀÌ ÀåÀ» ÅëÇØ Äڵ带 ½Å·ÚÇÒ ¼ö ÀÖ°Ô µ½´Â´Ù.
¡Ú ÁöÀºÀÌÀÇ ¸» ¡Ú
pandas´Â ÆÄÀ̽ãÀ» »ç¿ëÇØ ±¸Á¶ÈµÈ µ¥ÀÌÅ͸¦ ¸¸µé°í Á¶ÀÛÇϱâ À§ÇÑ ¶óÀ̺귯¸®´Ù. ±¸Á¶ÈÇß´Ù´Â °ÍÀº ¹«½¼ ÀǹÌÀϱî? ±¸Á¶È¶õ ½ºÇÁ·¹µå½ÃÆ®³ª µ¥ÀÌÅͺ£À̽º¿¡¼¿Í °°ÀÌ Çà°ú ¿ÀÇ Å×À̺í Çü½ÄÀ¸·Î µÈ µ¥ÀÌÅ͸¦ ÀǹÌÇÑ´Ù. µ¥ÀÌÅÍ °úÇÐÀÚ, ºÐ¼®°¡, ÇÁ·Î±×·¡¸Ó, ¿£Áö´Ï¾î µîÀº µ¥ÀÌÅ͸¦ È°¿ëÇÏ°íÀÚ ÀÌ·± Çü½ÄÀÇ µ¥ÀÌÅ͸¦ È°¿ëÇÏ°í ÀÖ´Ù. pandas´Â 'ÀÛÀº µ¥ÀÌÅÍ'(´ÜÀÏ ½Ã½ºÅÛ ¸Þ¸ð¸®¿¡ µé¾î°¥ ¼ö ÀÖ´Â µ¥ÀÌÅÍ)¸¸ ´Ù·ê ¼ö ÀÖ´Ù. ±×·¯³ª pandasÀÇ ±¸¹®°ú ¿¬»êÀº PySpark, Dask, Modin, cuDF, Baloo, Dexplo, Tabel, StaticFrame µî ´Ù¸¥ ÇÁ·ÎÁ§Æ®¿¡ äÅõǰųª ¿µ°¨À» Áá´Ù. ÇÁ·ÎÁ§Æ®¿¡´Â ´Ù¾çÇÑ ¸ñÇ¥°¡ ÀÖÁö¸¸ ÀϺΠÇÁ·ÎÁ§Æ®´Â ºòµ¥ÀÌÅÍ·Î È®ÀåµÈ´Ù. µû¶ó¼ pandas´Â ±¸Á¶ÈµÈ µ¥ÀÌÅÍ¿Í »óÈ£ÀÛ¿ëÇϱâ À§ÇÑ »ç½Ç»ó Ç¥ÁØ API°¡ µÇ°í ÀÖÀ¸¹Ç·Î ÀÛµ¿ ¹æ½ÄÀ» ÀÌÇØÇÒ °¡Ä¡°¡ ÀÖ´Ù. ³» À̸§Àº ¸ÅÆ® Çظ®½¼(Matt Harrison)ÀÌ¸ç ±â¾÷ ±³À°À» ¼öÇàÇÏ´Â ¸ÞŸ½º³×ÀÌÅ©(MetaSnake)¶ó´Â ȸ»ç¸¦ ¿î¿µÇÑ´Ù. ³»°¡ ÇÏ´Â ÀÏÀº ÆÄÀ̽ã°ú µ¥ÀÌÅÍ ±â¼úÀ» Çâ»ó½ÃÅ°°íÀÚ ÇÏ´Â ´ë±â¾÷À» ÈÆ·ÃÇÏ´Â °ÍÀÌ´Ù. µû¶ó¼ ¼ö³â µ¿¾È ¼öõ ¸íÀÇ ÆÄÀ̽ã°ú pandas »ç¿ëÀÚ¸¦ °¡¸£ÃÆ´Ù. 2ÆÇÀ» ¾µ ¶§ ³» ¸ñÇ¥´Â pandas¿Í °ü·ÃÇØ ¸¹Àº »ç¶÷ÀÌ È¥µ¿À» °Þ´Â ºÎºÐÀ» ¿½ÉÈ÷ µ½´Â °ÍÀ̾ú´Ù. pandas´Â ¿©·¯ ÀÌÁ¡ÀÌ ÀÖÁö¸¸ ¾î·Æ°í È¥¶õ½º·¯¿î Á¡ÀÌ ÀÖ´Ù. µ¶ÀÚ ¿©·¯ºÐÀÌ ½ÇÁ¦ ȯ°æ¿¡¼ ±×·¯ÇÑ ¹®Á¦Á¡À» ÇØ°áÇÒ ¼ö ÀÖµµ·Ï µ½°íÀÚ ÇÑ´Ù. ¶óÀÌºê ±³À°¿¡ °ü½ÉÀÌ ÀÖ´Ù¸é ¾ðÁ¦µçÁö ¹®ÀÇÇ϶ó(matt@metasnake).
|
|
|
|
|