๋ชจ๋“ ๋‚  88

[Week7 AWS ํด๋ผ์šฐ๋“œ] TIL 26์ผ์ฐจ - AWS ํด๋ผ์šฐ๋“œ ์•Œ์•„๋ณด๊ธฐ

์ด๋ฒˆ์‹œ๊ฐ„์—๋Š” ํด๋ผ์šฐ์Šค ์„œ๋น„์Šค์™€ AWSํด๋ผ์šฐ๋“œ์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋„๋ก ํ•˜์ž. 0) ํด๋ผ์šฐ์Šค ์„œ๋น„์Šค ์ปดํ“จํŒ… IT ๋ฆฌ์†Œ์Šค๋ฅผ ์ธํ„ฐ๋„ท์„ ํ†ตํ•ด ํ•„์š”ํ•  ๋•Œ, ์ œ๊ณตํ•˜๊ณ  ์‚ฌ์šฉํ•œ ๋งŒํผ ์ง€๋ถˆํ•˜๋Š” ์„œ๋น„์Šค์ด๋‹ค. ํด๋ผ์šฐ๋“œ ํ”Œ๋žซํผ์—๋Š” ์„ธ ๊ฐ€์ง€ ๋ฐฉ์‹์ด ์žˆ๋Š”๋ฐ(์˜ฌํ•ด ์ •๋ณด์ฒ˜๋ฆฌ๊ธฐ์‚ฌ ์‹ค๊ธฐ ์‹œํ—˜ ๋ฌธ์ œ์— ์ถœ์ œ๋˜๊ธฐ๋„ ํ–ˆ๋‹ค) ํด๋ผ์šฐ๋“œ ํ”Œ๋žซํผ ์œ ํ˜• Own premises IAAS (Infrastructure as a Service) PAAS (Platform as a Service) SAAS (Software as a Service) ์„ค๋ช… ์ž์ฒด ๋ฐ์ดํ„ฐ ์„ผํ„ฐ๋‚˜ ๋กœ์ปฌ ํ™˜๊ฒฝ์—์„œ ์„œ๋ฒ„, ์Šคํ† ๋ฆฌ์ง€, ๋„คํŠธ์›Œํ‚น ๋“ฑ์˜ IT ์ธํ”„๋ผ๋ฅผ ์šด์˜ํ•˜๊ณ  ์œ ์ง€๋ณด์ˆ˜ ๊ธฐ๋ณธ์ ์ธ ์ธํ”„๋ผ๋ฅผ ๊ฐ€์ƒํ™”๋œ ํ˜•ํƒœ๋กœ ์ œ๊ณต ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์„ ๊ฐœ๋ฐœํ•˜๊ณ  ๋ฐฐํฌํ•˜๊ธฐ ์œ„ํ•œ ํ”Œ๋žซํผ์„ ์ œ๊ณต ์™„์ „ํ•œ ์†Œํ”„ํŠธ์›จ์–ด ์• ํ”Œ๋ฆฌ์ผ€..

[Week6 ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค์™€ SQL ๊ธฐ๋ณธ] TIL 24์ผ์ฐจ - JOIN ์—ฐ์‚ฐ

์ด๋ฒˆ์‹œ๊ฐ„์—๋Š” SQL์˜ JOIN ์—ฐ์‚ฐ์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž. 0) JOIN ์ด๋ž€ ๋‘ ๊ฐœ ์ด์ƒ์˜ ํ…Œ์ด๋ธ”์„ ํŠน์ • ์กฐ๊ฑด์— ๋งž์ถฐ์„œ merge ํ•˜๋Š” ๊ฒƒ. ์šฐ์„ , ๋‘ ๊ฐœ์˜ ํ…Œ์ด๋ธ”์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜๊ณ  ์™ผ์ชฝ ํ…Œ์ด๋ธ”์„ left, ์˜ค๋ฅธ์ชฝ ํ…Œ์ด๋ธ”์„ right์ด๋ผ๊ณ  ํ•œ๋‹ค. 1) ํ…Œ์ด๋ธ”์˜ ๊ด€๊ณ„ 1:1 ์™„์ „ 1:1์ธ ํ…Œ์ด๋ธ”์ด๊ฑฐ๋‚˜, ํ•œ ํ…Œ์ด๋ธ”์ด ๋‹ค๋ฅธ ํ…Œ์ด๋ธ”์˜ ๋ถ€๋ถ„ ์ง‘ํ•ฉ์ธ ๊ฒฝ์šฐ์ด๋‹ค. ๋ณดํ†ต, join ์—ฐ์‚ฐ ์‹œ ํฌ๊ฒŒ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•˜์ง€ ์•Š๋Š”๋‹ค. 1:๋‹ค join ์—ฐ์‚ฐ์‹œ ๊ธฐ์ค€์„ ์ž˜ ๋ชป ์žก์œผ๋ฉด ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค. ๋‹ค:๋‹ค ๊ฐ€๋Šฅํ•˜๋ฉด join ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•˜์ง€ ์•Š๊ณ  ๋‹ค:1, 1:1, 1:๋‹ค ํ…Œ์ด๋ธ”๋กœ ๋ณ€ํ™˜ํ•ด์„œ ์‚ฌ์šฉํ•˜๋„๋ก ํ•œ๋‹ค. โ€ป ์–ด๋Š ํ…Œ์ด๋ธ”์„ ๊ธฐ์ค€์œผ๋กœ ์กฐ์ธํ• ์ง€๋ฅผ ์ž˜ ์„ค์ •ํ•ด์•ผ ํ•œ๋‹ค. โ€ป 2) 6๊ฐ€์ง€ JOIN ์—ฐ์‚ฐ INNER JOIN LEFT, RIGHT ํ…Œ์ด๋ธ”์˜ ๊ต์ง‘..

[Week6 ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค์™€ SQL ๊ธฐ๋ณธ] TIL 23์ผ์ฐจ - Google Colab์—์„œ ๋ฐ์ดํ„ฐ์›จ์–ดํ•˜์šฐ์Šค ์—ฐ๊ฒฐํ•ด ์‚ฌ์šฉํ•˜๊ธฐ

์ด๋ฒˆ์‹œ๊ฐ„์—๋Š” ์ฝ”๋žฉ์— ๋ฐ์ดํ„ฐ์›จ์–ดํ•˜์šฐ์Šค(Redshift)์— ์—ฐ๊ฒฐํ•˜๊ณ  ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€๊ณตํ•ด ๋ณด์ž. 0) ๋ฐ์ดํ„ฐ ์Šคํ‚ค๋งˆ ์ •๋ณด(ํด๋”) ๐Ÿ“ row data ๐Ÿ“ analytics ๐Ÿ“ adhoc ETL ๊ณผ์ •์—์„œ ์ˆ˜์ง‘๋œ ๋ฐ์ดํ„ฐ row data์˜ ํ…Œ์ด๋ธ”์„ ์กฐํ•ฉํ•ด์„œ ๋งŒ๋“  ์ƒˆ๋กœ์šด ํ…Œ์ด๋ธ” 1) ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค(Redshift) Colab์— ์—ฐ๊ฒฐํ•˜๊ธฐ %load_ext sql %sql postgresql:/*redshift ์„œ๋ฒ„ ์—ฐ๊ฒฐ ์ฃผ์†Œ*/ %%sql ์›ํ•˜๋Š” sql ๋ฌธ์žฅ ์œ„์˜ ์ฝ”๋“œ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ์•„๋งˆ์กด์˜ Redshift ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค์— ์—ฐ๊ฒฐํ•˜๊ณ , SQL ๋ฌธ์žฅ์„ ์ž…๋ ฅํ•˜์—ฌ ์›ํ•˜๋Š” ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋‹ค. 2) ํ…Œ์ด๋ธ”์„ (ํŒ๋‹ค์Šค) Dataframe ์ž๋ฃŒํ˜•์œผ๋กœ ๋ณ€ํ™˜ result=%sql SELECT * FROM ์ธ์Šคํ„ด์Šค๋ช….ํ…Œ์ด๋ธ”๋ช… df =..

[Week6 ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค์™€ SQL ๊ธฐ๋ณธ] TIL 22์ผ์ฐจ - Redshift ์‚ฌ์šฉํ•˜๊ธฐ

์ด๋ฒˆ์ฃผ์—๋Š” Redshift๋ฅผ ๊ตฌ์ถ•ํ•˜๊ณ  Colabํ™˜๊ฒฝ์—์„œ ์ด๋ฅผ ์‚ฌ์šฉํ•ด๋ณด๋Š” ์‹ค์Šต์„ ์ง„ํ–‰ํ•œ๋‹ค. ์šฐ์„ , AWS์‚ฌ์˜ Redshift๋ฅผ ๊ตฌ์ถ•ํ•ด๋ณด์ž. 0) Redshift๋ž€? Redshift๋Š” ํด๋ผ์šฐ๋“œ ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค ์„œ๋น„์Šค์ด๋‹ค. (↔ํ”„๋กœ๋•์…˜ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค) 1.๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ ์•„ํ‚คํ…์ฒ˜ ์‚ฌ์šฉ : ๋Œ€๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์ฟผ๋ฆฌ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋ฉฐ, ํด๋Ÿฌ์Šคํ„ฐ์˜ ํฌ๊ธฐ๋ฅผ ์กฐ์ •ํ•˜์—ฌ ํ™•์žฅ์„ฑ์„ ํ™•๋ณด 2. ์ปฌ๋Ÿผ ๊ธฐ๋ฐ˜ ์ €์žฅ : ํ•„์š”ํ•œ ์ปฌ๋Ÿผ๋งŒ์„ ์ฝ์–ด์˜ค๋Š”๋ฐ ํšจ๊ณผ์ . ๋ถ„์„ ์ฟผ๋ฆฌ์— ์ ํ•ฉํ•˜๋ฉฐ, ๋ฐ์ดํ„ฐ ์••์ถ• ๋ฐ ์ €์žฅ ๊ณต๊ฐ„์„ ์ตœ์ ํ™” 3. SQL ํ˜ธํ™˜์„ฑ : ๊ธฐ์กด SQL ์ฟผ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ์— ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ์Œ 1) Redshift ๊ตฌ์ถ• 1. ์šฐ์„  ๋‚ด๊ฐ€ ์‚ฌ์šฉํ•˜๋ ค๋Š” ์ง€์—ญ๊ณผ ์„ค์ •๋œ ์ง€์—ญ์ด ๋™์ผํ•œ์ง€ ํ™•์ธํ•œ๋‹ค. Seoul 2. Amazon redshift๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ ..

[Week6 ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค์™€ SQL ๊ธฐ๋ณธ] TIL 21์ผ์ฐจ - ๊ด€๊ณ„ํ˜• ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์™€ SQL

0) ๋ฐ์ดํ„ฐ ๊ทธ๋ฃน์›์˜ ์—ญํ•  1. ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด ๋ฐ์ดํ„ฐ์›จ์–ดํ•˜์šฐ์Šค์™€ ๋ฐ์ดํ„ฐ๋ฅผ ์ ์žฌํ•˜๋Š” ETL/ELT ๋“ฑ์˜ ํ”„๋กœ์„ธ์Šค๋ฅผ ๋‹ด๋‹น ํ•„์š”ํ•œ ์Šคํ‚ฌ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด(python, java) ETL/ELT ๋ถ„์‚ฐํ™˜๊ฒฝ Spark, Hadoop ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค 2. ๋ฐ์ดํ„ฐ ๋ถ„์„๊ฐ€ : DB์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์ฝ์–ด์„œ ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ์ˆ˜ํ–‰(ํ†ต๊ณ„์  ์ง€์‹) 3. ๋ฐ์ดํ„ฐ ๊ณผํ•™์ž : ํšจ๊ณผ์ ์ธ ๋ฐ์ดํ„ฐ๋ชจ๋ธ์„ ์ฐพ๊ณ , ๊ฐœ๋ฐœํ•˜๊ณ , ์ด๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์˜ˆ์ธก์„ ์ˆ˜ํ–‰ 1) ๊ด€๊ณ„ํ˜• ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์™€ SQL ๊ด€๊ณ„ํ˜• ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ณ  ์งˆ์˜ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ์ €์žฅ ์žฅ์น˜ 1. ํ”„๋กœ๋•์…˜ ๋ฐ์ดํ„ฐ ๋ฒ ์ด์Šค OLTP(Online Transaction Processing) ์‹ค์‹œ๊ฐ„ ํŠธ๋žœ์žญ์…˜ ์ฒ˜๋ฆฌ ์‹œ์Šคํ…œ์œผ๋กœ ๊ฐ„๋‹จํ•˜๊ณ  ๋ฐ˜๋ณต์ ์ธ ํŠธ๋žœ์žญ์…˜์„ ์‹ ์†ํ•˜๊ฒŒ ์ฒ˜๋ฆฌํ•˜๋Š”๋ฐ ํŠนํ™”๋˜์–ด ์žˆ๋‹ค. (..

[Git\Github] ๊นƒํ—ˆ๋ธŒ์˜ ๋น„์–ด์žˆ์ง€ ์•Š์€ ๋ ˆํฌ์ง€ํ† ๋ฆฌ์— ๋กœ์ปฌ ํด๋” ์—…๋กœ๋“œ ํ•˜๊ธฐ

๊นƒํ—ˆ๋ธŒ์— ํŠน์ • ๋ ˆํฌ์ง€ํ† ๋ฆฌ๋ฅผ ์ƒ์„ฑํ•˜๊ณ , ๋ ˆํฌ์ง€ํ† ๋ฆฌ ์•ˆ์—์„œ ํด๋”๋ฅผ ๊ด€๋ฆฌํ•˜๋Š”๋ฐ ํ”„๋กœ์ ํŠธ๋ฅผ ํ•˜๋‹ค ๋ณด๋‹ˆ ๋กœ์ปฌ ํด๋”๋ฅผ ํ†ต์งธ๋กœ ๋น„์–ด์žˆ์ง€ ์•Š์€ ๊นƒํ—ˆ๋ธŒ ๋ ˆํฌ์ง€ํ† ๋ฆฌ์— ์˜ฌ๋ ค์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ์ƒ๊ฒผ๋‹ค. ์ธํ„ฐ๋„ท์— ์ฐพ์•„๋ณด๋‹ˆ ๋ณดํ†ต ๋นˆ ๋ ˆํฌ์ง€ํ† ๋ฆฌ์— (๋‚ด ์ปดํ“จํ„ฐ์˜)๋กœ์ปฌํด๋”๋ฅผ ์—ฐ๋™์‹œํ‚ค๋Š” ๊ฒฝ์šฐ๋Š” ๋งŽ์€๋ฐ ๋‹ค๋ฅธ ํŒŒ์ผ/ํด๋”๊ฐ€ ์žˆ๋Š” Github ๋ ˆํฌ์ง€ํ† ๋ฆฌ์— ๋กœ์ปฌ ํด๋”๋ฅผ ์˜ฌ๋ฆฌ๋Š” ๋ฐฉ๋ฒ•์€ ์ฐพ๊ธฐ ์–ด๋ ค์›Œ์„œ ์ง์ ‘ ๊ธ€์„ ์จ ๋ณด๊ธฐ๋กœ ํ•˜์˜€๋‹ค. Git Bash๋ฅผ ์ด์šฉํ•œ ์—…๋กœ๋“œ git bash๋ฅผ ์ด์šฉํ•ด์•ผ ํ•˜๋‹ˆ git์ด ๋กœ์ปฌ์— ์„ค์น˜๋˜์—ˆ๋Š”์ง€ ์šฐ์„  ํ™•์ธํ•ด๋ณด์ž. 1. ์—…๋กœ๋“œ๋ฅผ ์›ํ•˜๋Š” ํด๋” ์ƒ์œ„ ํด๋”์— [๋งˆ์šฐ์Šค์˜ค๋ฅธ์ชฝ]-์ถ”๊ฐ€์˜ต์…˜ํ‘œ์‹œ-Open Git Bash here์„ ์„ ํƒํ•œ๋‹ค. 2. ๊นƒ์„ ์ดˆ๊ธฐํ™”ํ•œ๋‹ค. git init 3. ๋กœ์ปฌ ์ €์žฅ์†Œ์™€ ๊นƒํ—ˆ๋ธŒ ๋ ˆํฌ์ง€ํ† ๋ฆฌ๋ฅผ ์—ฐ๊ฒฐํ•œ๋‹ค git rem..

[Week3 ์›น๋ฐ์ดํ„ฐ ํฌ๋กค ๋ฐ ๋ถ„์„] TIL 10์ผ์ฐจ - Seaborn ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ํ†ตํ•œ ์‹œ๊ฐํ™”

0) Seaborn ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ matplotlib์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” ์‹œ๊ฐํ™” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๋‹ค์–‘ํ•œ ๊ทธ๋ž˜ํ”„๋ฅผ ๊ณ ์ˆ˜์ค€์—์„œ ์‰ฝ๊ฒŒ ๊ทธ๋ฆด ์ˆ˜ ์žˆ๋‹ค. 1) ๊ทธ๋ž˜ํ”„์˜ ์ข…๋ฅ˜ 1. figure-level vs axes-level seaborn ํ•จ์ˆ˜๋Š” matplotlib ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋กœ ์ปค์Šคํ„ฐ๋งˆ์ด์ง• ํ•˜๊ฑฐ๋‚˜ ์ž์ฒด ์ปค์Šคํ„ฐ๋งˆ์ด์ง•์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋ฅผ ๊ตฌ๋ถ„ํ•˜๊ธฐ ์œ„ํ•ด์„  figure-level๊ณผ axes-level์— ๋Œ€ํ•œ ์ดํ•ด๊ฐ€ ํ•„์š”ํ•˜๋‹ค. figure-level ํ•ด๋‹น ๋ ˆ๋ฒจ์˜ ํ•จ์ˆ˜๋Š” seaborn ๊ฐ์ฒด๋ฅผ ํ†ตํ•ด์„œ matplotlib๊ณผ ์ƒํ˜ธ์ž‘์šฉ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— FacetGrid(seaborn์˜ figure)์„ ์ด์šฉํ•ด์„œ ๊ทธ๋ž˜ํ”„ ์ปค์Šคํ„ฐ๋งˆ์ด์ง•์„ ์ˆ˜ํ–‰ํ•ด์•ผ ํ•œ๋‹ค. replot displot catplot lmplot axes-level ํ•ด๋‹น ๋ ˆ๋ฒจ์˜ ํ•จ์ˆ˜๋Š” ..

[Week3 ์›น๋ฐ์ดํ„ฐ ํฌ๋กค ๋ฐ ๋ถ„์„] TIL 9์ผ์ฐจ - Selenium์œผ๋กœ ์Šคํฌ๋ž˜ํ•‘ํ•˜๊ธฐ

0) Selenium ํŒจํ‚ค์ง€ ์–ด์ œ ๋งํ–ˆ๋“ฏ, BeautifulSoup ํŒจํ‚ค์ง€๋กœ๋Š” ๋™์ ์œผ๋กœ ์ƒ์„ฑ๋œ ์ •๋ณด๋Š” ๊ฐ€์ ธ์˜ฌ ์ˆ˜ ์—†์—ˆ๋‹ค. ๋™์  ์›น์‚ฌ์ดํŠธ๋Š” ๋น„๋™๊ธฐ๋ฐฉ์‹์œผ๋กœ ์ž‘๋™ํ•˜๋Š”๋ฐ ๋žœ๋”๋ง์ด ์™„๋ฃŒ๋˜์—ˆ์„ ๋•Œ ๋ฐ์ดํ„ฐ ๋กœ๋”ฉ์ด ๊ผญ ์™„๋ฃŒ๋˜๋Š” ๊ฒƒ์€ ์•„๋‹ˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ๋”ฐ๋ผ์„œ Selenium ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•ด์„œ ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ์ •๋ณด๋ฅผ ๊ฐ€์ ธ์˜ค๋ ค ํ•œ๋‹ค. Sellenium ํŒจํ‚ค์ง€๋ฅผ ์ด์šฉํ•˜๋ฉด ํŒŒ์ด์ฌ์œผ๋กœ ๋‹ค์Œ ๋‘ ๊ฐ€์ง€ ๋™์ž‘์ด ๊ฐ€๋Šฅํ•˜๋‹ค. 1. ์ž๋ฐ”์Šคํฌ๋ฆฝํŠธ๊ฐ€ ๋™์ ์œผ๋กœ ๋งŒ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ์Šคํฌ๋ž˜ํ•‘ 2. ์‚ฌ์ดํŠธ์— ์ด๋ฒคํŠธ(๋งˆ์šฐ์Šค ํด๋ฆญ, ํ‚ค๋ณด๋“œ ์ž…๋ ฅ ๋“ฑ)๋ฅผ ์ฃผ๊ธฐ ์‹ค์Šต์„ ํ†ตํ•ด ๋‹ค์Œ ๋‘ ๊ฐ€์ง€์˜ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ด ๋ณด์ž. 1) ์›ํ•˜๋Š” ์ •๋ณด ๊ฐ€์ ธ์˜ค๊ธฐ ์˜ค๋Š˜๋‚ ์˜ ์›น ํŽ˜์ด์ง€๋Š” ์›นํฌ๋กค๋Ÿฌ๋‚˜ ๋‹ค๋ฅธ ์Šคํฌ๋ž˜ํ•‘ ์‚ฌ์šฉ์ž๋“ค์ด ์‰ฝ๊ฒŒ ์ •๋ณด๋ฅผ ๊ฐ€์ ธ๊ฐ€์ง€ ๋ชปํ•˜๋„๋ก ํด๋ž˜์Šค ์ด๋ฆ„์„ ๋žœ๋ค ํ•˜๊ฒŒ ์ƒ์„ฑํ•œ๋‹ค. ex)..

[Week3 ์›น๋ฐ์ดํ„ฐ ํฌ๋กค ๋ฐ ๋ถ„์„] TIL 8์ผ์ฐจ - ๋ฐ์ดํ„ฐ ํฌ๋กค๋ง ๊ธฐ์ดˆ(2)

1) BeautifulSoup ์–ด์ œ request.get ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•ด ์›น ํŽ˜์ด์ง€๋กœ๋ถ€ํ„ฐ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€์ ธ์˜ค๋Š” ์ž‘์—…์„ ์ˆ˜ํ–‰ํ–ˆ๋‹ค. ๊ทธ๋Ÿฐ๋ฐ, ์ด๋Ÿฐ ์‹์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์Šคํฌ๋ž˜ํ•‘ํ•˜๋ฉด ๋ชจ๋“  ๋ฐ์ดํ„ฐ์˜ ๊ตฌ๋ถ„ ์—†์ด ํ•œ ์ค„๋กœ ํ‘œ์‹œ๋œ๋‹ค. ์›ํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ„ํŽธํ•˜๊ฒŒ ๊ฐ€์ ธ์˜ค๊ธฐ ์œ„ํ•ด BeautifulSoup ํŒจํ‚ค์ง€๋ฅผ ์ด์šฉ๋ณด์ž. BeautifulSoup ํŒจํ‚ค์ง€๋ž€? html๊ณผ xml๋ฌธ์„œ๋ฅผ ํŒŒ์‹ฑ ํ•˜๋Š” ํŒจํ‚ค์ง€๋กœ ๊ตฌ๋ฌธ ๋ถ„์„ ํŠธ๋ฆฌ๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ฐ„ํŽธํ•˜๊ฒŒ ์›ํ•˜๋Š” ์ •๋ณด๋ฅผ ์ฐพ์„ ์ˆ˜ ์žˆ๋‹ค. html์˜ ํƒœ๊ทธ๋ช…, id, class ์ด๋ฆ„์„ ์ด์šฉํ•˜์—ฌ ์›ํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ„ํŽธํ•˜๊ฒŒ ์ฐพ์„ ์ˆ˜ ์žˆ์–ด ๋ฐ์ดํ„ฐ ํฌ๋กค๋ง/์Šคํฌ๋ž˜ํ•‘ ์‹œ ๋งŽ์ด ์‚ฌ์šฉํ•œ๋‹ค. ์‚ฌ์šฉ 1. ์›ํ•˜๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ์–ด๋Š ์œ„์น˜์—, ์–ด๋–ค ํƒœ๊ทธ๋กœ ๊ฐ์‹ธ์ ธ ์žˆ๋Š”์ง€ ํ™•์ธํ•œ๋‹ค. 2. requests.get ๋ฉ”์„œ๋“œ๋ฅผ ์ด์šฉํ•ด ์›น์‚ฌ์ด..

[Week3 ์›น๋ฐ์ดํ„ฐ ํฌ๋กค ๋ฐ ๋ถ„์„] TIL 7์ผ์ฐจ - HTTP์™€ ๋ฐ์ดํ„ฐ ํฌ๋กค๋ง ๊ธฐ์ดˆ(1)

1) ์ธํ„ฐ๋„ท๊ณผ ์›น 0. ์šฉ์–ด์ •๋ฆฌ ๋„คํŠธ์›Œํฌ(Network) ๋‘ ๊ฐœ์˜ ์ปดํ“จํ„ฐ๊ฐ€ ์—ฐ๊ฒฐํ•œ ๊ฒƒ LAN(Local Area Network) ๊ทผ๊ฑฐ๋ฆฌ ์ง€์—ญ ๋„คํŠธ์›Œํฌ(์ผ์ • ๊ฑฐ๋ฆฌ์˜ ์ปดํ“จํ„ฐ๋“ค์„ ์—ฐ๊ฒฐํ•œ ๊ฒƒ) ์ธํ„ฐ๋„ท(Internet) ๋ฒ” ์ง€๊ตฌ์ ์œผ๋กœ ๋„คํŠธ์›Œํฌ๋ฅผ ์—ฐ๊ฒฐํ•œ ๊ฒƒ ์›น(Web) : ์ธํ„ฐ๋„ท์—์„œ ์ •๋ณด๋ฅผ ๊ตํ™˜ํ•  ์ˆ˜ ์žˆ๋Š” ํ™˜๊ฒฝ, ์‹œ์Šคํ…œ ๊ทธ๋ ‡๋‹ค๋ฉด, ์›น ์ƒ์—์„œ ์ •๋ณด๋ฅผ ์–ด๋–ป๊ฒŒ ์ฃผ๊ณ ๋ฐ›์„๊นŒ? 1) ์›น์—์„œ ์ •๋ณด ์ฃผ๊ณ ๋ฐ›๊ธฐ 0. ์šฉ์–ด ์ •๋ฆฌ ํด๋ผ์ด์–ธํŠธ : ์ •๋ณด๋ฅผ ์š”์ฒญํ•˜๋Š” ์ปดํ“จํ„ฐ ์„œ๋ฒ„ : ์ •๋ณด๋ฅผ ์ œ๊ณตํ•˜๋Š” ์ปดํ“จํ„ฐ 1. ์ •๋ณด๋ฅผ ์ฃผ๊ณ ๋ฐ›๋Š” ๋ฐฉ๋ฒ• ํด๋ผ์ด์–ธํŠธ๋Š” ์„œ๋ฒ„์—๊ฒŒ HTTP ์š”์ฒญ(request)์„ ๋ณด๋‚ธ๋‹ค. ์„œ๋ฒ„๋Š” ํ•ด๋‹น ์š”์ฒญ์— ๋Œ€ํ•ด ์ฒ˜๋ฆฌํ•œ๋‹ค. ์ฒ˜๋ฆฌ๊ฐ€ ์™„๋ฃŒ๋œ ๊ฒฐ๊ณผ์— ๋Œ€ํ•ด ์„œ๋ฒ„๋Š” ํด๋ผ์ด์–ธํŠธ์—๊ฒŒ HTTP ์‘๋‹ต(response)์„ ๋ณด๋‚ธ๋‹ค. 2. ์ •๋ณด๋ฅผ ์ฃผ๊ณ ๋ฐ›๊ธฐ ์œ„..

728x90