Welcome !
N.K Github

[GP] R ν”„λ‘œκ·Έλž˜λ°κ³Ό 데이터-처리

λ°˜μ‘ν˜•

이 글은 N.K Dev Labμ—μ„œ μž‘μ„±λœ κΈ€μž…λ‹ˆλ‹€.

μ•ˆλ…•ν•˜μ„Έμš”. μš” λͺ‡ κ°œμ›” κ°„ 제 λΈ”λ‘œκ·Έμ˜ ν¬μŠ€νŒ…μ΄ μ—†μ—ˆμ£ ?.. μš”μ¦˜ 데이터와 μ”¨λ¦„ν•˜λŠλΌκ³  정신이 μ—†μ—ˆμŠ΅λ‹ˆλ‹€. 이제 ν”„λ‘œκ·Έλž˜λ°μ„ λ„˜μ–΄μ„œ 데이터에 λŒ€ν•œ μž‘μ—…μ„ μ‘°κΈˆμ”© λ°°μ›Œλ‚˜κ°€κ³  μžˆμŠ΅λ‹ˆλ‹€λ§Œ SQL λͺ¨λΈλ§μ€ 쑰금 ν•΄λ΄€μœΌλ©΄μ„œλ„ κ°€μž₯ 기초적인 λ°μ΄ν„°μ²˜λ¦¬ 등은 μ„œνˆ΄λŸ¬μ„œ μž‘μ—…μ„ ν•˜λŠ”...

μ €λŠ” 은근 My-way μŠ€νƒ€μΌμ΄λ©΄μ„œλ„ 가끔씩은 이게 λ§žλ‚˜ 싢은 고민이 생길 λ•ŒλŠ” κ°€μ΄λ“œλΌμΈμ„ 타곀 ν•©λ‹ˆλ‹€. ν•˜μ§€λ§Œ κ·Έ κ°€μ΄λ“œλΌμΈμ„ λ³΄λ©΄μ„œλ„ β€œλΉ„νš¨μœ¨μ μ΄λ‹€β€, β€œλ‚΄ μŠ€νƒ€μΌμ€ μ•„λ‹ˆλ‹€.”, β€œλ” κΉ”λ”ν•˜κ²Œβ€λΌλŠ” μš•μ‹¬μ„ κ°€μ§€κ²Œ λ˜λŠ”λ°, κ·ΈλŸ¬λ‹€λ³΄λ©΄ ν•œμ°Έμ„ κ³ λ―Όν•˜λ‹€κ°€λ„ 진도 진행이...

Data Processing

μ†Œν”„νŠΈμ›¨μ–΄ 개발자 μž…μž₯μ—μ„œ 데이터 μ²˜λ¦¬β€¦ 사싀 DBA의 직책을 κ°€μ§€μ‹  뢄듀이 주둜 ν•˜λŠ” 일이라고 λ³΄λŠ” 것이 λ§žκ² μ§€λ§Œ μ†Œν”„νŠΈμ›¨μ–΄ κ°œλ°œμžκ°€ μ§μ ‘μ μœΌλ‘œ 데이터에 κ΄€μ—¬ν•˜λŠ” κ²½μš°λŠ” 극히 λ“œλ­…λ‹ˆλ‹€. 사싀상 μ†Œν”„νŠΈμ›¨μ–΄ κ°œλ°œμžλŠ” μ‚¬μš©μžμ˜ 츑면을 κ³ λ €ν•˜κ³  μ–Όλ§ˆλ‚˜ νŽΈν•˜κ³  더 쒋은 κ²°κ³Όλ₯Ό...

ν•˜μ§€λ§Œ μ΄λ²ˆμ— 데이터 처리λ₯Ό ν•˜λ©΄μ„œ 사싀상 μ΄λ ‡κ²Œ 마ꡬ작이둜 λ§ˆμ΄λ‹ν•œ 데이터λ₯Ό μ²˜λ¦¬ν•˜μ—¬ 정보와 μ§€μ‹μœΌλ‘œ λ§Œλ“œλŠ” λ°λŠ” μ—¬λŸ¬ μ•Œκ³ λ¦¬μ¦˜μ„ μ‚¬μš©ν•΄μ•Ό ν•©λ‹ˆλ‹€. λ”°λΌμ„œ 데이터 μ²˜λ¦¬μ™€ μ†Œν”„νŠΈμ›¨μ–΄μ˜ κ°œλ°œμ€ λ°˜λ“œμ‹œ λ°˜λŒ€μ˜ 츑면을 κ°€μ§€μ§€ μ•ŠλŠ”λ‹€λŠ” 것을 μ•Œκ²Œ λ˜μ—ˆμŠ΅λ‹ˆλ‹€. μ†Œν”„νŠΈμ›¨μ–΄λ₯Ό 개발...

ETL

데이터 처리 μž‘μ—…μ„ ν•˜λ©΄μ„œ λ“£κ²Œ 된 단어 쀑 ν•˜λ‚˜κ°€ λ°”λ‘œ ETLμ΄λΌλŠ” λ‹¨μ–΄μ˜€μŠ΅λ‹ˆλ‹€. 사싀 데이터 μ—”μ§€λ‹ˆμ–΄μ— μž…λ¬Έν•œ 것은 μ²˜μŒμ΄μ—ˆκ³  κ·Έ 쀑 μ œκ°€ μ œκ°€ 처음 ν–ˆλ˜ μž‘μ—…μ΄ ETLμ΄λΌλŠ” 것도 μž‘μ—…μ„ ν•˜λŠ” 도쀑 μ•Œκ²Œ λ˜μ—ˆμŠ΅λ‹ˆλ‹€. ETL은 Extract(μΆ”μΆœ), Transform...

μ œκ°€ κ°„λ‹¨νžˆ ν•˜κ³  μžˆλŠ” 일을 λ§μ”€λ“œλ¦¬μžλ©΄, μ €λŠ” μ–΄λ–€ 이미지λ₯Ό κ°€μ§€κ³  ν•΄λ‹Ή 이미지가 μ–΄λ–€ 이미지인지, ν¬κΈ°λŠ” μ–Όλ§ˆλ‚˜ λ˜λŠ”μ§€, λ§Œμ•½ 크기가 λ‹€λ₯΄λ‹€λ©΄ 일정 크기에 맞좰 λ³€ν™˜ν•˜λŠ” μž‘μ—…μ„ 거쳐야 ν•˜κ³ , 그거에 λ§žμΆ°μ„œ λ‹€μ‹œ DB에 μ μž¬ν•˜μ—¬μ•Ό ν•©λ‹ˆλ‹€. 쑰금 λ‹€λ₯Έ 원리λ₯Ό μ•Œκ²Œ 된 ...

ν•˜μ§€λ§Œ 이미지 λ°μ΄ν„°μ˜ μΆ”μΆœμ€ ν”½μ…€ 데이터가 될 μˆ˜λ„ μžˆμŠ΅λ‹ˆλ‹€. 이λ₯Όν…Œλ©΄ OpenCV와 같은 컴퓨터 λΉ„μ „ 라이브러리λ₯Ό μ‚¬μš©ν•΄μ„œ ν”½μ…€ 데이터λ₯Ό λΆ„μ„ν•˜κ³  이λ₯Ό ν†΅ν•˜μ—¬ 데이터λ₯Ό μΆ”μΆœν•˜λŠ” 방법도 μžˆκ² μ§€λ§Œ μš”μ¦˜μ—λŠ” 메타데이터 ν™œμ„±ν™”κ°€ 잘 λ˜μ–΄μž‡λŠ”μ§€ μ΄λŸ¬ν•œ 메타데이터λ₯Ό λ§ˆμ΄λ‹ν•˜λŠ”...

μ •ν™•ν•˜κ²ŒλŠ” μž‘μ€ 규λͺ¨μ˜ ν”„λ‘œκ·Έλž¨μ€ 파일 λ‹¨μœ„λ‘œ λΌμ΄λΈŒλŸ¬λ¦¬λ‚˜ νŒ¨ν‚€μ§€λ₯Ό μ΄μš©ν•΄ κ·Έ 데이터듀을 κ°„λ‹¨νžˆ κΈμ–΄μ™€μ„œ ν‘œν˜„ν•  수 μžˆμ§€λ§Œ λ°μ΄ν„°μ˜ 규λͺ¨κ°€ 컀지면 그것 λ˜ν•œ ν•œκ³„κ°€ μƒκΉλ‹ˆλ‹€. 또 ν”„λ‘œκ·Έλž˜λ° μ–Έμ–΄μ—μ„œ μ§€μ›ν•˜λŠ” 자료 κ΅¬μ‘°λŠ” ν•œμ •λ˜μ–΄ 있고 λΉ… 데이터λ₯Ό μ²˜λ¦¬ν•˜κΈ° μœ„ν•΄ Data...

R

μ œκ°€ 처음 λ³Έ R μ–Έμ–΄λŠ” Pythonκ³Ό μœ μ‚¬ν•œ μ–Έμ–΄μ˜€μŠ΅λ‹ˆλ‹€. λ³€μˆ˜ νƒ€μž…μ„ μ§€μ •ν•˜μ§€ μ•Šκ³  자유둭게 μ‚¬μš©ν•  수 μžˆλŠ” 슀크립트 ν˜•νƒœμ˜ μ–Έμ–΄, ν•˜μ§€λ§Œ μ €μ—κ²Œ μ΅μˆ™ν•΄μ§€λŠ” 데 λ„ˆλ¬΄λ‚˜ λ§Žμ€ μ‹œκ°„μ„ λ“€μ—¬μ•Ό ν–ˆμŠ΅λ‹ˆλ‹€. λ‹¨μˆœνžˆ μžλ£Œν˜• νƒ€μž…μ„ μ§€μ •ν•˜μ§€ μ•ŠλŠ” 문제 λ•Œλ¬Έμ΄ μ•„λ‹ˆλΌ μ—¬λŸ¬κ°€μ§€ λ¬Έ...

...

...

μ΄μ–΄μ„œ μ½μœΌμ‹œλ €λ©΄ μ•„λž˜μ˜ λ²„νŠΌμ„ ν΄λ¦­ν•΄μ£Όμ„Έμš”....

...

... 계속 읽기

...


λ°˜μ‘ν˜•
TAGS.

Tistory Comments