| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- OPC-UA
- CS
- OPC-UA Download
- java란?
- 스프링부트의 장단점
- 컴퓨터과학
- prosys opc-ua
- REST API
- jvm구성요소
- Prosys Opc-ua 다운로드
- 스프링부트 단점
- C# Blazor
- nosql
- java란 무엇인가
- 서버저장방식
- cs기술면접
- UaExpert download
- Service Worker
- 프론트엔드
- Blazor Web App
- 기술면접
- opc-ua 다운로드
- 스프링부트 장점
- UaExpert다운로드
- Redundant Array of Independent
- C# CS
- C#이론
- spring spring boot 차이점 공통점
- 스프링 스프링부트 차이점 공통점
- Blazor WebAssembly
- Today
- Total
담비의 개발블로그
Hadoop(하둡이란) 본문
하둡이란
하둡(Hadoop)은 대용량 데이터(빅데이터)를 저장하고 분산 처리할 수 있도록 설계된 프레임워크이다. 간단히 비유하자면, 하나의 거대한 슈퍼컴퓨터로 엄청난 양의 데이터를 처리하는 대신, 여러 대의 일반 컴퓨터들을 네트워크로 연결하여(이를 '클러스터'라고 부름) 데이터를 나누어 저장하고, 작업을 병렬로 처리하는 기술이다.
◆ 하둡의 핵심 구성 요소
- HDFS (Hadoop Distributed File System): 분산 저장
대용량 파일을 여러 대의 컴퓨터(노드)에 나누어 저장하는 파일 시스템이다. 데이터를 여러 복사본으로 만들어 저장하기 때문에, 일부 컴퓨터에 문제가 생겨도 데이터가 유실되지 않는 '내결함성(Fault Tolerance)'이 높다.
- MapReduce (맵리듀스): 분산 처리
HDFS에 저장된 대용량 데이터를 여러 컴퓨터에서 동시에 병렬로 처리하는 프로그래밍 모델이다. 데이터를 처리하는 'Map' 단계와, 처리된 결과를 하나로 모으는 'Reduce' 단계로 나뉜다. (최근에는 MapReduce보다 더 빠르고 유연한 Spark와 같은 다른 처리 엔진을 YARN 위에서 사용하는 경우가 많다.)
- YARN (Yet Another Resource Negotiator): 자원 관리
클러스터(컴퓨터 묶음)의 자원(CPU, 메모리 등)을 관리하고, MapReduce나 Spark 같은 애플리케이션이 원활하게 동작할 수 있도록 자원을 스케줄링하고 할당해주는 역할을 한다.
◆ 하둡의 주요 특징
- 확장성 (Scalability): 데이터가 많아지면 클러스터에 컴퓨터(노드)를 쉽게 추가하여 저장 공간과 처리 능력을 늘릴 수 있다.
- 비용 효율성 (Cost-effectiveness): 고가의 특수 장비가 아닌, 일반적인 사양의 저렴한 컴퓨터(범용 하드웨어)를 여러 대 묶어서 사용할 수 있어 비용이 저렴한다.
- 내결함성 (Fault Tolerance): 데이터가 여러 곳에 복제되고 작업이 분산되므로, 특정 하드웨어에 장애가 발생해도 전체 시스템은 중단 없이 작동한다.
- 유연성 (Flexibility): 정형 데이터(예: 엑셀 표)뿐만 아니라 비정형 데이터(예: 로그 파일, 소셜 미디어 텍스트, 이미지) 등 모든 종류의 데이터를 저장하고 처리할 수 있다.
'개발관련이야기' 카테고리의 다른 글
| 키보드에서 a키를 눌렀을때 모니터 a라는 글자가 뜨는 과정은 무엇인가요? (0) | 2025.10.28 |
|---|---|
| url창에 naver.com을 입력하면 네이버가 뜨는 원리는 무엇인가요? (0) | 2025.10.27 |
| [기타]Scheme이란? (1) | 2024.12.12 |
| [PWA]Service Worker가 필요한 이유 (0) | 2024.11.26 |
| [PWA] Manifest/Service Worker (1) | 2024.11.22 |