일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- airflow
- Example DAG
- Namenode
- Service
- slack
- HDFS
- docker
- 람다 아키텍처
- yarn
- Scala
- Windows
- re
- java
- MapReduce
- 빅데이터
- LDAP
- slack app
- python
- HIVE
- execution_date
- jupyter
- HDP
- HBase
- SlackWebhookOperator
- NoSQL
- hadoop
- ambari
- Kafka
- Lambda architecture
- 정규표현식
- Today
- Total
목록빅데이터 (2)
IT 삽질기
빅데이터 처리 과정 빅데이터 처리 과정에 대해서 알아보자 지난번 빅데이터의 정의에 대해서 알아보았다 2020/06/24 - [BigData] - 빅데이터의 정의 빅데이터의 정의 빅데이터의 정의 빅데이터가 어떻게 정의되어 있는지 알아보자 빅데이터에 대해 다양한 곳에서 각기 다르게 정의하고 있는데 몇몇 정의를 살펴보자 빅데이터란 기존 DB의 관리도구의 능력을 넘 dydwnsekd.tistory.com 빅데이터를 어떻게 처리하는지 알아보도록 하자 빅데이터 아래와 같은 순서를 가진다 수집 적재 처리/탐색 분석/응용 1. 수집 데이터를 처리하기 위해 먼저 데이터를 수집해야 하는데 조직의 내 외부에 있는 데이터를 수집한다 데이터 크롤링, DB, 파일, API 등 정형/비정형 데이터를 처리해 수집한다. 2. 적재 수..
빅데이터의 정의 빅데이터가 어떻게 정의되어 있는지 알아보자 빅데이터에 대해 다양한 곳에서 각기 다르게 정의하고 있는데 몇몇 정의를 살펴보자 빅데이터란 기존 DB의 관리도구의 능력을 넘어서는 대량의 정형 또는 DB형식이 아닌 비정형의 데이터 집합조차 포함된 데이터롤부터 가치를 추출하고 결과를 분석하는 기술 즉, 기존의 데이터 베이스로는 처리하기 어려울 정도로 방대한 양의 데이터 - 위키백과 https://ko.wikipedia.org/wiki/%EB%B9%85_%EB%8D%B0%EC%9D%B4%ED%84%B0 빅 데이터 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. 빅 데이터(영어: big data)란 기존 데이터베이스 관리도구의 능력을 넘어서는 대량(수십 테라바이트)의 정형 또는 ..