ADP 10

[자격증] ADP 실기 후기 (30회)

정말 지긋지긋한 ADP 자격증 시험 회차 : 30회 일시 : 2023.09.02(토) 장소 : 부산 센텀직업전문학교 5층 몇 번째 방문인가... 그나마 다행히도(?) 최근 2년간 본 시험중에 난이도가 젤 낮았던 것 같다 먼저 간단하게 이번 차수 시험 문제를 설명하겠다 머신러닝(60점) / 통계(40점) 머신러닝(60점) 건강검진 데이터 x : 키, 몸무게, 허리둘레, 나이, 중성지방 등 (대략 10개) y값 : 혈압 1-1 데이터 탐색 (EDA) 1-2 전처리 수행 및 설명 1-3 데이터 분할(7:3) 및 확인 2-1 혈압(y)예측 회귀모델 3개 선정 및 이유(장단점) 설명 2-2 데이터가 회귀 모델 기본 가정을 따르는지 검증 2-3 RMSE 값을 기준으로 최적의 알고리즘 선정 3-1 분할한 데이터로 모..

Study 2023.09.04

[자격증] 데이터분석전문가 ADP 26회 실기 후기

2022.09.25(일) ADP 26회 실기 시험 후기 이번 시험은 정말 역대급 난이도였다 보통 시험을 보고 나면 이번에 몇점 정도 나오겠다는 감이 있는데 이번엔 정말 모르겠다 솔직한 감정은 화가난다!!!!! 정말 한국데이터산업진흥원 너무 한 거 아님니꽈.... 선은 넘으시면 안되죠.... 그래서 결심했다 이 자격증은 나랑 맞지 않는걸로,,, 그래도 다음 시험 보실 분들을 위해 시험문제 간단하게 기억나는대로 적어보겟다 머신러닝(50점) 온라인 주문데이터 (고객ID, 제품분류, 제품코드, 가격, 수량 등등) 데이터 수 약 38000개 K-means, DBSCAN 등 기법을 활용하여 군집 분류 이상치, 결측치 처리하고 이유 왜 그 기법을 사용했는지 이유 군집 수를 결정한 이유 KNN 기법활용해서 군집별로 가..

Study 2022.09.26

[자격증] ADP 25회 실기 시험 후기

하하하 도대체 몇번째 시험인지.... 일단 느낌은 나쁘지 않은 것 같다 공부를 많이 하지는 못했지만, 그거에 비해서는 잘(?)친 느낌?? 생각나는대로 문제를 적어보겠다. 1. 기계학습 1-1 고객 주문 데이터로 고객별 주문건수와 주문총금액을 데이터를 만들어서 군집분석 수행 1-2 주어진 시계열 데이터로 계절성을 포함하여 모델링 하기 2. 통계 1-1 기초통계 문제 4개 (평균속력, 평균 연매출 증가율??) 1-2 분산이 특정 범위에 들어오는지 검정 (향기가 지속되는 시간의 분산) 1-3 공장 3개위 제품 무게가 같은지 검정 (주어진 데이터 제품무게, 순위) 1-4 최적화 문제 투자금액과 NPV(?) 최대가 되는 최적의 투자인 찾기 음..... 항상 느끼는 거지만 칠 때마다 이 시험은 생각보다 어렵다 언제..

Study 2022.06.20

[자격증] 데이터분석전문가 ADP 실기 24회 후기

몇번 째 치는지도 모르겠다..... 너무 어려운 것 같다ㅜㅜ 그래도 기억나는대로 문제를 적어보자 1. 기계학습 - 탐색적 분석, 시각화 포함 - 전처리, 시각화 영향 - 추가 고려사항, 왜? 방법 기대효과 등 - 예측모델 3개 추천, 2개 선정 이유 설명 - 모델 성능평가 지표, 설명 - 모델 2개 구현, 성능 산출 및 시각화 - 모델을 다른 환경에 적용 가능한가? 시각화 - 보완할 점? - 다중회귀 정의, 회귀계수 검정 - 회귀모형 유의성 검정 2. 통계 - 위병률 데이터 - 연구가설, 귀무가설 - 검정통계량, 채택여부 - 코로나 데이터(진단키트, 바이러스 감염여부) - 양성이면서 바이러스 확률 (베이즈 정리) - 공장 제품 길이 데이터 - 제품 평균 깅이 95% 신뢰구간 진짜 너무너무 어렵다ㅜㅜㅜㅜㅜ..

Study 2022.05.11

ADP 23회 데이터분석 전문가 실기 후기

정말 오랜만에 글을 쓴다. 글쓰는 재미를 잃어 버렸다. 분명히 올해 초에는 재밌었는데,,, 다시 글쓰는 재미를 찾아보려고 한다. 그 첫번째 글로는 자격증 시험 후기를 선택했다. 다른 사람들 그리고 불합격을 대비해 미래의 나를 위해 기록을 남기려고 한다. 역시나 이번 시험도 생각보다 어려웠다. 간단하게 써보면 객실의 사용 유무를 분류하는 문제가 나왔다. x인자로는 이산화탄소, 조도, 습도, 온도 이렇게 4가지가 있었다. 객실의 사용유무 변수의 클래스 불균형이 존재했다. 그래서 2가지의 오버샘플링을 제시하고 오버 샘플링이 최종 분류 모델에 어떤 영향을 줬는지 분석했어야 했다. 최종 모델은 정확도 측면, 속도 측면 각각 하나씩 만들어야 했으며, 원데이터와 오버샘플링한 데이터 들과의 결과도 비교 해야 했다. 두..

Study 2021.12.20

[자격증] ADP 실기 세번째 후기...

데이터 분석을 업으로 하지 않다보니 너무 공부량이 부족하다... 그래도 포기하지 않고 도전하겠다!!!! 시험의 유형이 조금씩 조금씩 변하는게 느껴진다. 기억나는대로 정리해보겠다. 1. 당뇨병 발병여부 데이터 (number형 변수 10개 정도, 대략 총 750건) - 결측치, 이상치 탐색 및 보정 (처리하는게 좋은가 나쁜가) - down sampling, up sampling (어떤 samling 기법이 좋은가) - 당뇨병 발병여부 분류 모델 3가지 이상 만들기 (실행속도 측면 좋은거 1개, 예측 결과 측면 좋은거 1개 포함) - 차원축소 아이디어 제시 2. 차량 생산에 들어가는 귀금속 무게 데이터(x변수 1개) - 연구가설, 귀무가설 정의 - 양측검정 - CL, UCL, LCL 구하기 3. 제품 생산 재..

Study 2021.10.28

[자격증] 빅데이터분석기사 필기/실기 후기

올해 새로 생긴 빅데이터분석기사 시험을 쳤다. 어느정도 레벨의 시험인지 전혀 감이 없는 상태로 준비를 시작했다. 필기책을 사서 하루에 1-2시간씩 2주정도 봤다. ADP 내용과 거의 90% 비슷한 내용이었다. 한번 본 내용이라서 이론은 책읽듯이 한번 정독하고 대부분의 시간을 문제를 푸는데 할애했다. ADP자격증을 준비하던 나에게 빅분기 준비는 크게 어렵지 않았다. 필기는 합격 커트라인이 60점이기 때문에 크게 걱정하지 않았다. 문제의 난이도가 크게 어렵지 않았고, 80점으로 합격했다. 솔직히 실기는 어떻게 준비를 해야할 지 몰라서 거의 하지 않았다. ADP 공부하던 책을 다시한번 정독한게 전부다. 역시나 난이도가 쉬웠다. 데이터 전처리, 간단한 예측 모델 하나 만들기가 전부였다. 결과는 76점으로 합격!..

Study 2021.07.24

[자격증] 빅데이터분석기사 필기 시험 후기

2021년 4월 17일 처음 시행된 빅데이터분석기사 필기 시험을 봤다. 공부를 많이 하지는 못했다. 하루에 한두시간씩 2주 정도 수제비라는 책으로 공부했다. ADP 자격증을 준비하면서 같이 공부해서 그런지 생각보다 어렵지는 않았다. 물론 합격을 확신하지는 않지만 60점만 넘으면 합격이기에 충분히 가능성이 있어보인다. 최종목표능 ADP를 따는 것이지만 중간에 빅분기를 먼저 취득하는 것도 나쁘지 않다고 생각한다. 올해에는 ADP와 빅분기 두가지 모두 꼭 취득하고 싶다!!!

카테고리 없음 2021.04.19

두번째 데이터분석 전문가 ADP 실기 시험

후.... 점점 더 어려워 지는 것 같다. 합격 할 수 있을까....? 1-1 Random Forest, SVM 모델링 (10점) - 전처리 데이터 프로파일링 - 결측치 - 다른 전처리 - 최종 데이터셋에 품질 문제 없는가? - 학습, 시험 데이터 구분 1-2, Random Forest (15점) - 예측 기준선 설정 - 모델 학습, 성능 테스트 - 예측 결과 확인, 모델 개선 - 특정 중요성 분석 결과 시각화 1-3, SVM (15점) - 예측 기준선 설정 - 모델 학습, 성능 테스트 - 예측 결과 확인, 모델 개선 - 특정 중요성 분석 결과 시각화 1-4, 두 모델 성능 비교 (10점) - 예측 성능 비교 - 각각 장단점 - 향후 운영 고려 최종 모델 선택 - 최종 선정된 모델의 제약사항 - 추가 개..

카테고리 없음 2021.03.27

[자격증] 데이터 분석 전문가 (ADP) 실기 시험 후기

먼저 결론부터 말씀드리면 불!합!격! 하하하데이터 분석 전문가(ADP) 자격증을 2020년 목표로 세우고 열심히(?) 노력 했으나 아쉽게 떨어졌다. 먼저 시험문제를 기억나는대로 적어보겠다 1번 1) 주어진 데이터를 적절하게 전처리 및 시각화 2) 7:3으로 데이터를 train, test로 나누고 최소 3가지 이상의 분류 모델 생성 Confusion Matrix 생성 및 결과 비교 3) 앙상블 모델로 예측파일 활용 및 예측 결과 생성 2번 1) 시계열 데이터 시각화 제시 이분산성 & 정상성 판단 2) 정상성 판단 근거를 활용하여 고정 시계열 추가 탐색 3) SARIMA 모델에 대한 일련의 매개변수 테스트 가장 성능 좋은 모델을 제시 4) 모델 수행 결과 잔차, 잡음 시각화하고 분석 결과 제시 시험치기 직전..

Study 2021.01.18