°³¶ËÀ̳׿¡¼ ÆÇ¸ÅµÈ "¹ÙÀÌ¿À ÆÄÀ̽ãÀ¸·Î ¸¸³ª´Â »ý¹°Á¤º¸ÇÐ" Á¤°¡ 26,000¿ø Æò±ÕÇÒÀΰ¡
|
|
|
¼½¼Ç 1. ¹ÙÀÌ¿ÀÆÄÀ̽ã
1Àå ¹ÙÀÌ¿ÀÆÄÀ̽㠼Ұ³ 1.1 ¹ÙÀÌ¿ÀÆÄÀ̽ãÀ̶õ 1.2 ¹ÙÀÌ¿ÀÆÄÀ̽ãÀ¸·Î ÇÒ ¼ö ÀÖ´Â Àϵé 1.3 Á¤¸® 1.4 ¿¬½À¹®Á¦
2Àå ¹ÙÀÌ¿ÀÆÄÀ̽㠼³Ä¡ 2.1 ¾Æ³ªÄÜ´ÙÆÄÀ̽㠼³Ä¡ 2.2 ¹ÙÀÌ¿ÀÆÄÀ̽㠼³Ä¡ ¿©ºÎ È®ÀÎ 2.3 ¹ÙÀÌ¿ÀÆÄÀ̽㠼³Ä¡(À©µµ¿ì) 2.4 ¹ÙÀÌ¿ÀÆÄÀ̽㠼³Ä¡(¸Æ/¸®´ª½º) 2.5 ¹ÙÀÌ¿ÀÆÄÀ̽㠹öÀü ¾÷±×·¹À̵å 2.6 ¹ÙÀÌ¿ÀÆÄÀ̽㠻èÁ¦ 2.7 Jupyter Notebook 2.8 ¿¬½À¹®Á¦
3Àå »ý¹°Á¤º¸ÇÐ ÆÄÀÏ Æ÷¸Ë ¼Ò°³ 3.1 FASTA/FASTQ 3.2 SAM/BAM 3.3 BED 3.4 VCF 3.5 GenBank 3.6 XML 3.7 JSON 3.8 Á¤¸® 3.9 ¿¬½À¹®Á¦
4Àå À¯ÀüÀÚ ¼¿ ´Ù·ç¾îº¸±â : Sequence °´Ã¼ 4.1 TATA Box¶õ 4.2 °´Ã¼¶õ 4.3 Sequence °´Ã¼ ¼Ò°³ 4.4 Sequence °´Ã¼ ´Ù·ç±â 4.5 Bio.SeqUtils ¸ðµâ È°¿ë 4.6 Á¤¸® 4.7 ¿¬½À¹®Á¦
5Àå Sequence record °´Ã¼ 5.1 SeqRecord °´Ã¼ 5.2 SeqRecord °´Ã¼ÀÇ ¼Ó¼º 5.3 SeqRecord °´Ã¼ ¸¸µé±â 5.4 SeqRecord °´Ã¼ °£ ºñ±³Çϱâ 5.5 Á¤¸® 5.6 ¿¬½À¹®Á¦
6Àå FASTA, FASTQ, GenBank ÆÄÀÏ : Sequence Àбâ 6.1 SeqIO ¸ðµâ·Î Sequence ÆÄÀÏÀ» Àд µÎ °¡Áö ¹æ¹ý - FASTA ÆÄÀÏ Àбâ 6.2 SeqIO.parse() ¸Þ¼µå·Î FASTQ ÆÄÀÏ Àбâ 6.3 GenBank ÆÄÀÏ Àбâ 6.4 ÀÎÅͳÝÀ» ÅëÇÑ ÆÄÀÏ Àбâ : CCR5 À¯ÀüÀÚ¿Í HIV ÀúÇ×¼º 6.5 Á¤¸® 6.6 ¿¬½À¹®Á¦
7Àå Àΰ£°ú ´Ù¸¥ µ¿¹°Àº ¾ó¸¶³ª ´Ù¸¦±î? Á¾ °£ Â÷ÀÌÁ¡ÀÇ ºñ¹Ð: Multiple Sequence Alignment 7.1 Multiple Sequence Alignment Áغñ °úÁ¤ 7.2 Multiple Sequence Alignment ÆÄÀÏ Àбâ 7.3 Alignment ´Ù·ç±â 7.4 Alignment Åø MUSCLE 7.5 WebLogo·Î º¸Á¸ ¼¿ ¾Ë¾Æº¸±â 7.6 °èÅë¼ö ±×·Áº¸±â 7.7 Á¤¸® 7.8 ¿¬½À¹®Á¦
8Àå ¿øÀÎ ºÒ¸íÀÇ È¯ÀÚ¿¡¼ ³ª¿Â ¹ÌÁöÀÇ Á¾ ã±â : BLAST 8.1 ¹ÌÁöÀÇ Á¾ ¹ß°ß 8.2 À¥ºê¶ó¿ìÀú¿¡¼ NCBI BLAST ½ÇÇà 8.3 ¹ÙÀÌ¿ÀÆÄÀ̽ãÀ¸·Î BLAST ½ÇÇà 8.4 Á¤¸® 8.5 ¿¬½À¹®Á¦
9Àå NCBI µ¥ÀÌÅͺ£À̽º 9.1 Entrez 9.2 EFetch: ¼Ò¾Æ¸¶ºñ¸¦ ÀÏÀ¸Å°´Â poliovirus µ¥ÀÌÅÍ Àбâ 9.3 EInfo: EntrezÀÇ µ¥ÀÌÅͺ£À̽º ¸ñ·Ï 9.4 ESearch : Entrez µ¥ÀÌÅͺ£À̽º¸¦ °Ë»ö 9.5 Á¤¸® 9.6 ¿¬½À¹®Á¦
10Àå ´Ü¹éÁúÀÇ ¼¼°è·Î : Swiss-Prot°ú ExPASy 10.1 Swiss-Prot 10.2 ExPASy 10.3 Á¤¸® 10.4 ¿¬½À¹®Á¦
11Àå °èÅëºÐ·ùÇÐ ºÐ¼® : Bio.Phylo 11.1 °èÅëºÐ·ùÇÐ 11.2 Newick Æ÷¸Ë ¼³¸í 11.3 ¹ÙÀÌ¿ÀÆÄÀ̽ã Phylo ¸ðµâ 11.4 Phylo ¸ðµâ·Î °èÅë¼ö ±×¸®±â 11.5 Á¤¸® 11.6 ¿¬½À¹®Á¦
12Àå ½Ã½ºÅÛ»ý¹°ÇÐ Áöµµ : KEGG 12.1 KEGG¶õ 12.2 ÇØ´ç °úÁ¤ 12.3 KEGG °´Ã¼ ÆÄ½Ì 12.4 KEGG API »ç¿ë¹ý 12.5 Á¤¸® 12.6 ¿¬½À¹®Á¦
13Àå ¹ÙÀÌ¿ÀÆÄÀ̽ã È°¿ë ¿¬½À¹®Á¦
¼½¼Ç 2. »ý¹°Á¤º¸ÇÐ ÆÄÀ̽ã ÇÁ·Î±×·¡¹Ö
1. ÇÁ·Î±×·¡¹Ö ½ÃÀÛ ¹®Ç× 1) Hello, Bioinformatics ¹®Ç× 2) º¯¼ö »ç¿ë ¹®Ç× 3) ¿¬»êÀÚ ¼Ò°³ ¹®Ç× 4) if - else Á¶°Ç¹® ¹®Ç× 5) if - elif - else Á¶°Ç¹® ¹®Ç× 6) for¹® ¹®Ç× 7) ÁßøÀÌ ÀÖ´Â for¹® ¹®Ç× 8) while¹® ¹®Ç× 9) ÇÔ¼ö ¹®Ç× 10) ÇÔ¼ö - ÇÔ¼ö¿¡ °ª Àü´Þ ¹®Ç× 11) ÇÔ¼ö - ÇÔ¼ö¿¡¼ °ªÀÇ ¹Ýȯ ¹®Ç× 12) ÇÔ¼ö - ÇÔ¼ö¿¡ °ª Àü´Þ°ú ¹Ýȯ°ª ¹Þ±â ¹®Ç× 13) ÇϵåÄÚµù ÇÇÇϱâ, »ç¿ëÀڷκÎÅÍ °ª ¹Þ±â ¹®Ç× 14) »ç¿ëÀڷκÎÅÍ °ª ¹Þ±â È°¿ë ¹®Ç× 15) Ä¿¸Çµå¶óÀο¡¼ Àμö ÀԷ¹ޱ⠹®Ç× 16) ÆÄÀÏ Àб⠹®Ç× 17) ÆÄÀÏ ¾²±â ¹®Ç× 18) ÁÖ¼® ´Þ±â ¹®Ç× 19) ¿¹¿Ü ó¸®Çϱâ - µð¹ö±ë ¹®Ç× 20) ¿¹¿Ü ó¸®Çϱâ - ¿©·¯ ¿À·ùµé ó¸®Çϱâ
2. ÀÚ·áÇü ´Ù·ç±â 2.1 ¹®ÀÚ¿ ¹®Ç× 21) ¹®ÀÚ¿ ´õÇϱ⠹®Ç× 22) ¹®ÀÚ¿ ¹Ýº¹ÇÏ¿© ´õÇϱ⠹®Ç× 23) ¹®ÀÚ¿¿¡¼ n¹ø° ¹®ÀÚ Ãâ·ÂÇϱ⠹®Ç× 24) ¹®ÀÚ¿ ½½¶óÀÌ½Ì ¹®Ç× 25) ¹®ÀÚ¿ ±æÀÌ ±¸Çϱ⠹®Ç× 26) ¹®ÀÚ¿ ´ë¼Ò¹®ÀÚ º¯È¯Çϱ⠹®Ç× 27) ¹®ÀÚ¿ n¾¿ °Ç³Ê¶Ù¸ç Ãâ·ÂÇϱ⠹®Ç× 28) ¹®ÀÚ¿À» n°³¾¿ ³ª´©¾î Ãâ·ÂÇϱ⠹®Ç× 29) ¹®ÀÚ¿ ¼ø¼¸¦ °Å²Ù·Î µÚÁý¾î Ãâ·ÂÇϱ⠹®Ç× 30) ¹®ÀÚ¿ ¹Ù²Ù±â ¹®Ç× 31) ¿ª»óº¸ ¼¿(reverse complement sequence) ¸¸µé±â ¹®Ç× 32) ¹®ÀÚ¿¿¡¼ ƯÁ¤ ¹®ÀÚ°¡ ÀÖ´ÂÁö È®ÀÎÇϱ⠹®Ç× 33) ¹®ÀÚ¿¿¡¼ ƯÁ¤ ¹®ÀÚÀÇ index ¹øÈ£ Ãâ·ÂÇϱ⠹®Ç× 34) ¹®ÀÚ¿¿¡¼ ƯÁ¤ ¹®ÀÚ °³¼ö ¼¼±â ¹®Ç× 35) ¹®ÀÚ¿¿¡¼ ƯÁ¤ ¹®ÀÚ¸¦ ´Ù¸¥ ¹®ÀÚ·Î ±³Ã¼Çϱ⠹®Ç× 36) ¹®ÀÚ¿¿¡¼ ´Ü¾î °³¼ö ¼¼±â
2.2 ¼ýÀÚ ¹®Ç× 37) ÁÖ¾îÁø ¼öÀÇ Á¦°ö±Ù ±¸Çϱ⠹®Ç× 38) ÁÖ¾îÁø ¼öÀÇ Àý´ñ°ª ±¸Çϱ⠹®Ç× 39) ÁÖ¾îÁø ¼öÀÇ ·Î±×°ª ±¸Çϱ⠹®Ç× 40) ÁÖ¾îÁø ¼öÀÇ ÀÚ¿¬·Î±×°ª ±¸Çϱ⠹®Ç× 41) ¹ØÀÌ ´Ù¸¥ ·Î±×°ª ±¸Çϱ⠹®Ç× 42) ÁÖ¾îÁø ¼öÀÇ ¹Ý¿Ã¸²°ª ±¸Çϱâ - ½Ç¼ö ¹®Ç× 43) ÁÖ¾îÁø ¼öÀÇ ¹Ý¿Ã¸²°ª ±¸Çϱâ - Á¤¼ö ¹®Ç× 44) ³¼ö ¸¸µé±â ¹®Ç× 45) ·Î¶Ç ¹øÈ£ »ý¼º±â ¹®Ç× 46) ¹®ÀÚ¿¿¡¼ ¼ýÀÚ¸¸ °ñ¶ó³»±â
2.3 ¸®½ºÆ® ¹®Ç× 47) ¸®½ºÆ® ±æÀÌ ±¸Çϱ⠹®Ç× 48) ¸®½ºÆ®ÀÇ n¹ø° Ãâ·ÂÇϱ⠹®Ç× 49) ¸®½ºÆ® ½½¶óÀ̽ÌÇϱ⠹®Ç× 50) ¸®½ºÆ®¸¦ °Ç³Ê¶Ù¸ç ½½¶óÀ̽ÌÇϱ⠹®Ç× 51) ¸®½ºÆ®¸¦ °Å²Ù·Î µÚÁý±â ¹®Ç× 52) ¸®½ºÆ® ¿À¸§Â÷¼ø Á¤·ÄÇϱ⠹®Ç× 53) ¸®½ºÆ® ³»¸²Â÷¼ø Á¤·ÄÇϱ⠹®Ç× 54) ¸®½ºÆ®¿¡ ¿ä¼Ò Ãß°¡Çϱ⠹®Ç× 55) ¸®½ºÆ®ÀÇ Æ¯Á¤ À§Ä¡¿¡ ¿ä¼Ò Ãß°¡Çϱ⠹®Ç× 56) ¸®½ºÆ® ¿ä¼Ò Á¦°ÅÇϱ⠹®Ç× 57) ¸®½ºÆ®ÀÇ Æ¯Á¤ ¿ä¼Ò °³¼ö ¼¼±â ¹®Ç× 58) ¸®½ºÆ® ³»ºÎÀÇ ÃÖ´ñ°ª ±¸Çϱ⠹®Ç× 59) ¸®½ºÆ® ³»ºÎÀÇ ÃÖ¼Ú°ª ±¸Çϱ⠹®Ç× 60) ¸®½ºÆ® ³»ºÎÀÇ ¸ðµç ¿ä¼Ò ÇÕ ±¸Çϱ⠹®Ç× 61) ¸®½ºÆ® ³»ºÎÀÇ ¸ðµç ¿ä¼Ò Æò±Õ ±¸Çϱ⠹®Ç× 62) ¹®ÀÚ¿ÀÇ Æ¯Á¤ ±¸ºÐÀÚ¸¦ ±âÁØÀ¸·Î ¸®½ºÆ® ¸¸µé±â ¹®Ç× 63) ¸®½ºÆ®¸¦ ƯÁ¤ ±¸ºÐÀÚ ±âÁØÀ¸·Î ¹®ÀÚ¿ ¸¸µé±â ¹®Ç× 64) ¸®½ºÆ® ¼¯±â
2.4 »çÀü ¹®Ç× 65) ÆÄÀ̽㠻çÀü ÇüÅ ¾Ë¾Æº¸±â ¹®Ç× 66) »çÀü ¸¸µé±â ¹®Ç× 67) »çÀü¿¡¼ ¿ä¼Ò Á¦°ÅÇϱ⠹®Ç× 68) »çÀü¿¡ Å°°ªÀÌ ÀÖ´ÂÁö È®ÀÎÇϱ⠹®Ç× 69) »çÀüÀ» ÀÌ¿ëÇÏ¿© ¾Æ¹Ì³ë»ê ¼¿ÀÇ Á¾·ù °³¼ö ¼¼±â ¹®Ç× 70) »çÀü Å° Ãâ·ÂÇϱ⠹®Ç× 71) »çÀü °ª Ãâ·ÂÇϱ⠹®Ç× 72) »çÀü Å°-°ª ¸ðµÎ Ãâ·ÂÇϱ⠹®Ç× 73) »çÀü °ªÀ» ±âÁØÀ¸·Î Á¤·ÄÇϱâ
2.5 ¼¼Æ® ¹®Ç× 74) ¼¼Æ® ¸¸µé±â ¹®Ç× 75) ¼¼Æ® ÇÕÁýÇÕ ±¸Çϱ⠹®Ç× 76) ¼¼Æ® ±³ÁýÇÕ ±¸Çϱ⠹®Ç× 77) ¼¼Æ® ¿©ÁýÇÕ ±¸Çϱâ
2.6 Æ©Çà ¹®Ç× 78) Æ©Çà ¸¸µé±â ¹®Ç× 79) Æ©ÇÃÀÇ Æ¯¼º
3. Ŭ·¡½º ¹®Ç× 80) °´Ã¼ ¸¸µå±â ¹®Ç× 81) °´Ã¼ÀÇ ¼Ó¼º ¹®Ç× 82) °´Ã¼ÀÇ ¸Þ¼µå ¹®Ç× 83) °´Ã¼ÀÇ »ý¼ºÀÚ (__init__) ¹®Ç× 84) °´Ã¼ÀÇ ¼Ò¸êÀÚ (__del__) ¹®Ç× 85) °´Ã¼ÀÇ µ¡¼À (__add__) ¹®Ç× 86) °´Ã¼ÀÇ ºñ±³ (__gt__)
4. ¾Ë°í¸®Áò ¼Ò°³ ¹®Ç× 87) Àç±Í ¾Ë°í¸®Áò ±¸ÇöÇϱ⠹®Ç× 88) µ¿Àû°èȹ¹ý ±¸ÇöÇϱ⠹®Ç× 89) ¾Ë°í¸®Áò È°¿ë - kmer ¸¸µé±â ¹®Ç× 90) ¾Ë°í¸®Áò È°¿ë - Palindrome ã±â
5. »ý¹°Á¤º¸ÇÐ ÆÄÀÏ ´Ù·ç±â 5.1 FASTA ¹®Ç× 91) FASTA ÆÄÀÏ¿¡¼ ¿°±â °³¼ö ¼¼±â ¹®Ç× 92) FASTA ÆÄÀÏ¿¡¼ ·¹ÄÚµå °³¼ö ¼¼±â
5.2 VCF ¹®Ç× 93) VCF ÆÄÀÏ ¼Ò°³ - VCF ÆÄÀÏ¿¡¼ header¿Í data ºÐ¸®Çϱ⠹®Ç× 94) VCF ÆÄÀÏ¿¡¼ »ùÇà °³¼ö ¼¼±â ¹®Ç× 95) VCF ÆÄÀÏ¿¡¼ Filter¿ PASS¸¸ °ñ¶ó³»±â ¹®Ç× 96) VCF ÆÄÀÏ¿¡¼ º¯ÀÌ °³¼ö ¼¼±â ¹®Ç× 97) VCF ÆÄÀÏ¿¡¼ SNP, InDel °³¼ö ¼¼±â ¹®Ç× 98) VCFÆÄÀÏ¿¡¼ dbSNP¿¡ ¹ß°ßµÈ º¯ÀÌ °³¼ö ±¸Çϱ⠹®Ç× 99) VCFÆÄÀÏ¿¡¼ Ts/Tv ºñÀ² ±¸Çϱâ
5.3 BED ¹®Ç× 100) BED ÆÄÀÏÀÌ ´ã°í ÀÖ´Â Àüü ¿µ¿ª ±¸Çϱâ
½ÇÁ¦·Î Çö¾÷¿¡¼ »ç¿ëÇÏ´Â ¹ÙÀÌ¿ÀÆÄÀ̽㠸ðµâ°ú 100°³ÀÇ ÇÁ·Î±×·¡¹Ö ¿¹Á¦¸¦ ÅëÇØ »ý¹°Á¤º¸ÇÐ ÆÄÀ̽ã ÇÁ·Î±×·¡¹ÖÀÇ ±âÃʸ¦ ½×À» ¼ö ÀÖ´Â µµ¼!
½ñ¾ÆÁö´Â »ý¹°Á¤º¸ ºòµ¥ÀÌÅ͸¦ ó¸®ÇÔ¿¡ ÀÖ¾î ¹è¿ì±â ½±°í ¿øÇÏ´Â °á°ú¸¦ ½Å¼ÓÇÏ°Ô ¸¸µé¾î ³¾ ¼ö ÀÖ´Â ÆÄÀ̽ãÀº ÀÌ ½Ã´ëÀÇ ´Ü¿¬ Àαâ ÀÖ´Â ¾ð¾î´Ù. ¹ÙÀÌ¿ÀÆÄÀ̽ãÀº ÆÄÀ̽㠶óÀ̺귯¸® Áß Çϳª·Î À¯Àüü µ¥ÀÌÅÍ ¼¿À» Àаųª »ý¹°Á¤º¸ µ¥ÀÌÅÍ ´Ù·ç±â, NCBI¿Í °°Àº À¥ Á¤º¸ °¡Á®¿À±â ±×¸®°í »ý¹°Á¤º¸ ºÐ¼® Åø ½ÇÇà µîÀÇ ±â´ÉÀ» ÇÒ ¼ö ÀÖ´Ù.
º» µµ¼¿¡¼´Â °¢ À帶´Ù ¹ÙÀÌ¿ÀÆÄÀ̽ãÀÇ ¸ðµâµéÀ» ÇнÀÇÒ °ÍÀÌ´Ù. ½Ç¹«¿¡¼ ¶Ù°í ÀÖ´Â ÀÇ»ý¸í¿¬±¸ÀÚ ¹× »ý¹°Á¤º¸Çп¡ °ü½ÉÀÌ ÀÖ´Â ºÐµéÀÌ ¿¬±¸¿¡ Áï½Ã È°¿ëÇÒ ¼ö ÀÖµµ·Ï ½ÇÁ¦ »ý¹°Á¤º¸ µ¥ÀÌÅ͸¦ °¡Áö°í ¿¹Á¦¿Í ¿¬½À¹®Á¦¸¦ ²Ù·Áº¸¾Ò´Ù. ¶ÇÇÑ ±âÃÊ »ý¹°Á¤º¸ÇÐ ÆÄÀ̽ã ÇÁ·Î±×·¡¹ÖÀÇ ½Ç·Â Çâ»óÀ» À§ÇØ 100°³ ¹®Ç×ÀÇ ¿¬½À¹®Á¦µµ ±¸¼ºÇÏ¿´´Ù. °¢ ÀåÀÇ ³»¿ëÀ» ÇнÀÇÏ°í ¿¬½À ¹®Ç×À» ÇØ°áÇÏ´Ù º¸¸é °¢Á¾ »ý¹°Á¤º¸ ¹®Á¦¸¦ ¼Õ½±°Ô ÇØ°áÇÒ ¼ö ÀÖÀ¸¸®¶ó ¹Ï¾î ÀǽÉÄ¡ ¾Ê´Â´Ù.
[ÀÌ Ã¥ÀÇ Æ¯Â¡] o ½ÇÁ¦ »ý¹°Á¤º¸ÇÐ ¿¹Á¦¸¦ È°¿ëÇÑ ¹ÙÀÌ¿ÀÆÄÀ̽㠸ðµâÀÇ ÇнÀ o ½ÇÀü°ú °°Àº ¿¹Á¦¿Í ¿¬½À ¹®Ç×À¸·Î Áï½Ã Çö¾÷¿¡ È°¿ë °¡´É o 100°³ÀÇ ÆÄÀ̽㠹®Ç×À¸·Î ±âÃÊ »ý¹°Á¤º¸ÇÐ ÇÁ·Î±×·¡¹Ö ¿¬½À
[ÀÌ Ã¥ÀÌ ÇÊ¿äÇÑ µ¶ÀÚ] o ¹ÙÀÌ¿ÀÆÄÀ̽ãÀ¸·Î »ý¹°Á¤º¸ÇÐÀ» ¹è¿ì°í ½ÍÀº ÀÇ»ý¸í¿¬±¸ÀÚ o ÆÄÀ̽ãÀ¸·Î »ý¹°Á¤º¸ÇÐ µ¥ÀÌÅ͸¦ ´Ù·ç°í ½ÍÀº °³¹ßÀÚ o ½ÇÁ¦ ÄÚµù ¹®Á¦¸¦ ÇØ°áÇÏ¸ç »ý¹°Á¤º¸ÇÐ ÆÄÀ̽ã ÇÁ·Î±×·¡¹Ö ½Ç·ÂÀ» ¿Ã¸®°í ½ÍÀº ÇнÀÀÚ
[µ¶ÀÚ´ë»ó] ÃÊÁß±Þ
[¼Ò½ºÄÚµå ´Ù¿î·Îµå] https://github.com/bjpublic/biopython
|
|
|
|
|