과목명 |
모듈 |
세부과정 |
SQL / DataBase
|
DBMS 이해
|
DBMS 구조 이해
Database 유형과 구성요소
DBMS Transaction 관리
|
SQL 을 이용한 Data 처리
|
SELECT절 활용
조건(WHERE)처리와 정렬(ORDER BY)
그룹 데이터 처리(GROUP BY)와 그룹조건 처리(HAVING)
테이블간 JOIN 처리
SUBQUERY 활용 |
Transaction 처리
|
데이터 입력, 수정, 삭제
Transaction 처리 |
Object 생성 관리
|
테이블 생성과 관리
인덱스 생성과 관리 |
SQL 기본 및 활용
|
정보 요구 사항
DDL , DML , DCL, TCL
WHERE 절 , GROUP BY, HAVING 절 , ORDER BY 절
표준조인
집합연산자
계층형 질의
서브쿼리
그룹 함수, 윈도우 함수
|
RDBMS (MySQL)
|
MySQL설치, 접속, 계정 만들기와 권한 부여하기
테이블 작성과 수정, 삭제
SELECT 쿼리 (조건, 정렬, 조인, 서브쿼리, 함수)
DML (데이터 조작 쿼리)
|
R 기본 & R을 활용한 데이터 분석
|
R 개요 및 설치 패키지 이해 |
R 설치 및 패키지 설치
R 작동환경 이해
|
데이터 구조 이해 및 실습
|
주요 데이터구조 이해
-백터, 데이터프레임, 리스트데이터 처리,병합,
가공, 데이터마트 생성
|
데이터 구조의 처리
|
다양한 패키지를 활용한 데이터 전처리
변수 생성 및 계산
|
파일 및 DB 입출력
|
파일 입출력
DB 연결 및 쿼리 실행
|
데이터 병합 및 문자열 처리 |
행/ 열단위 병합
Merge 기능
문자열 처리를 통한 데이터 가공 |
* 분석 도구를 활용한 수리적 배경 * |
통계 주요개념의 이해
확률 주요개념의 이해
선형대수 주요개념의 이해
개념 리뷰 / 실데이터 대상 확률, 통계 적용
|
데이터 분석 개요 |
데이터 분석의 목적
추론과 예측 관점의 기법 정리 |
R _ 선형회귀 분석의 이해 및 활용 |
선형회귀분석 개요 및 주요 개념
계수의 해석 및 잔차의 이해
결과의 해석
단순회귀분석의 이해 및 적용
다중회귀분석의 이해 및 적용
|
R _ 선형모형의 활용 (포아송, 로지스틱) |
포아송회귀분석의 개요 및 적용 방안
로지스틱회귀분석의 개요 및 적용 방안 |
주요 개념 정리 및 실제 데이터 적용 실습 |
주요 내용 리뷰
실제 데이터 기반 적용 |
Python & Python을 활용한 데이터 분석
|
Python |
설치 및 패키지 설치
작동환경 이해 |
데이터 구조 이해 및 실습 |
주요 데이터구조 이해
-리스트/세트/테이터프레임
데이터처리/병합/가공/데이터 마트 생성 |
데이터 구조의 처리 |
다양한 패키지를 활용한 데이터 전처리
변수 생성 및 계산 |
파일 및 DB 입출력 |
파일입출력
DB연결 및 쿼리 실행 |
데이터 병합 및 문자열 처리 |
행/열단위 병합
Merge 기능
문자열 처리를 통한 데이터 가공 |
▲ 파이썬을 활용한 데이터 분석 _ SW/패키지 |
Python, Pandas, Numpy, Scipy 등 |
응용 데이터 및 웹 데이터 활용 및 분석
|
선형회귀 분석의 이해 및 활용 1 |
선형회귀분석 개요 및 주요 개념
계수의 해석 및 잔차의 이해 , 결과의 해석 |
선형회귀 분석의 이해 및 활용 2 |
단순회귀분석의 이해 및 적용
다중회귀분석의 이해 및 적용 |
선형모형의 활용:
포아송/로지스틱 |
포아송회귀분석의 개요 및 적용 방안
로지스틱회귀분석의 개요 및 적용 방안 |
주요 개념 정리 및
실제 데이터 적용 실습 |
주요 내용 리뷰
실제 데이터 기반 적용 |
웹 크롤링 이해 및
관련 함수/패키지 |
웹크롤링 방식 이해
관련 패키지, 함수 확인 및 실습 |
예제 사이트 웹크롤링 실습 |
예제 사이트 웹크롤링 적용
수집된 데이터 표현 및 정리 |
병렬처리를 활용한 웹크롤링 |
멀티코어 기반 웹수집 방식 |
웹 수집 데이터 전처리 |
JSON 형식 전처리
XML 형식 데이터 전처리 |
데이터 시각화 기법
|
데이터 시각화의 이해 |
시각화의 주요 개념
시각화 사례 |
시각화 관련 함수 및 패키지의 이해 |
시각화 관련 주요 패키지 및 함수 이해
패키지, 함수 사용법 실습 |
시각화 차트 별 특징 이해 및 활용 |
다양한 차트의 이해 및 활용
단변수 차트/ 이변수 차트 등 |
Python 주요 모듈 기반 웹 시각화 |
시각화 |
시각화 사례 및 실습 |
우수 시각화 사례 실습
실제 데이터의 웹 시각화 연습 |
텍스트마이닝과 토픽모델링
|
텍스트 데이터의 이해 |
텍스트 데이터 표현 및 처리방법 |
관련 함수 및 패키지 이해 |
Konlpy 기반 형태소 분석 기법
품사 태깅 및 nltk 적용
Gensim 모듈 활용 및 이해 |
코퍼스 생성 및 전처리 이해 및 실습 |
파일 및 디렉토리 내 텍스트 기반 코퍼스 생성
텍스트 전처리 과정(Stemming,Stopwords제거)
DTM 생성, TF-IDF 적용 |
텍스트마이닝 및 시각화 |
DTM 기반 머신러닝(지도/비지도학습)의 적용
워드클라우드 |
토픽모델링의 이해 및 적용 |
LDA 활용 코퍼스 내 토픽 발견
토픽의 활용 및 머신러닝 적용 |
오픈소스기반 머신러닝 학습 및 적용
|
지도학습의 이해 |
분류모형, Tree 기반 분류 이해
Decision Tree, Random Forest 기법의 이해 및 적용
분류 모형 성능평가 |
최신 분류모형의 이해 |
SVM의 이해 및 파라미터 튜닝 , KNN 이해 및 적용/ NB 이해 및 적용
분류기법 비교 평가
|
인공신경망 기반 분류모형의 이해 및 활용 |
인공신경망의 구성요소 이해
활성화함수의 이해 및 가중치 최적화 기법 이해
인공신경망을 통한 분류 기법
텍스트 데이터 적용을 위한 인공신경망 분류 |
비지도학습의 이해 : 군집,패턴 |
Kmeans클러스터링과 계층적 클러스터링의 이해
패턴 발견을 위한 Association Rule 이해
Sequential AR의 이해 |
비지도학습의 이해 : 그래프 |
그래프마이닝을 통한 연결 분석 , 소셜네트워크 분석의 이해 및 적용
링크 예측을 위한 그래프 분석 |
분류기법을 활용한 주가예측 |
주가예측과 관련한 머신러닝 적용 사례
정형 및 비정형 데이터 큐레이션
데이터 전처리 및 탐색적 데이터 분석 |
분류기법 기반 스팸 필터링 |
스팸필터링 데이터 큐레이션 및 전처리
스팸필터링 분류 적용을 위한 기법 비교평가
성능개선을 위한 분류기법 선택 |
군집분석을 통한 고객군 발견 및 활용 |
고객 데이터에 대한 탐색적 데이터 분석
클러스터링 기법을 적용한 고객군 발견
최적의 클러스터링 기법 및 파라미터 선택 |
매출데이터 패턴 발견 |
패턴 발견을 위한 매출데이터의 전처리
AR적용 및 파라미터 튜닝 통한 결과 발견 , 패턴 시각화 |
추천 기법의 이해 및 활용 |
추천 기법의 이해 : IBCF, UBCF
콘텐츠 사용 데이터 기반 IBCF의 적용
UBCF의 적용 , 추천 결과 검증 및 성능 개선 |
딥러닝 알고리즘 학습 (TensorFlow2, Keras)
|
AI 알고리즘의 이해
심층신경망의 이해 |
AI 알고리즘의 이해
인공신경망과 심층신경망
심층신경망의 특징 |
딥러닝 개요 및 기본 |
심층신경망 학습을 위한 딥러닝
활성화 함수 및 최적화 기법의 이해 |
딥러닝을 위한 함수/ 패키지의 이해 |
다양한 오픈소스 프레임워크의 이해
주요 함수 및 패키지 설치 및 활용 |
DNN, RNN, CNN의 이해 |
DNN의 이해 및 활용
RNN의 이해 및 활용
CNN의 이해 및 활용 |
워드임베딩의 이해 |
오토인코딩과 임베딩
워드임베딩의 이해
Word2Vec 이해 및 활용 |
오픈소스를 활용한 딥러닝 응용
|
딥러닝 기반 주가예측 |
주가예측과 관련한 딥러닝 적용 사례
정형 및 비정형 데이터 큐레이션
데이터 전처리 및 탐색적 데이터 분석
최적 딥러닝 기법의 발견 |
딥러닝 기반 고객 리뷰 감성 분석 |
온라인 리뷰 관련 딥러닝 적용 사례
텍스트마이닝
탐색적 데이터 분석
딥러닝 기반 감성분석 |
CNN 활용 이미지 인식 |
이미지 인식과 분류기법
CNN을 통한 이미지 분류
파라미터 튜닝 및 최적화 |
고객 리뷰 대상 word2vec의 활용 |
온라인 리뷰 워드임베딩 적용
Word2vec의 이해 및 활용 |
RNN 리뷰 및 LSTM의 이해 |
RNN의 특징 이해 및 LSTM소개
LSTM 파라미터 및 구조 이해 |
오픈소스 기반 LSTM 구현 |
Tensorflow 기반 LSTM 구현
LSTM 학습 및 파라미터 최적화 |
LSTM을 위한 텍스트데이터 처리 |
가상 대화 데이터 전처리
텍스트마이닝 |
비즈니스에 따른 빅데이터 프로젝트
|
과제 정의 및 분석기획 |
데이터 분석 과제 수행 방법론
데이터 분석 기획 및 과제 구체화 |
데이터 소싱 및 전처리 |
데이터 획득/전처리/활용방안 수립 |
데이터 분석 프로토타이핑 |
분석 목적에 따른 기법 선택
다양한 기법 비교 평가 |
데이터 분석 및 시각화 |
실데이터 분석 및 성능 평가
시각화 |
프로젝트 |
분석결과 기반 프로젝트 보고서 |