본문 바로가기

스터디/머신러닝4

인공지능, 머신러닝, 딥러닝의 관계 처음 인공지능을 배울 때 헷갈렸던 것들을 정리해보자. 1. 인공지능이란 무엇인가? AI (Artificial Intelligence)는 일반적으로 인간의 학습능력, 추론 능력, 지각 능력이 필요한 작업을 할 수 있도록 컴퓨터 시스템을 구현하려는 컴퓨터과학의 세부분야 중 하나이다. 2. 머신러닝 vs 딥러닝 머신러닝과 딥러닝의 차이가 무엇일까? 두가지는 다른 것일까?라는 의문이 생길 수 있다. 가장 쉬운 요점은 딥 러닝이 머신 러닝에 해당한다는 것이다. 구체적으로, 딥 러닝은 머신 러닝이 진화한 것으로 여겨진다. 딥 러닝은 기계가 사람의 도움 없이도 정확한 결정을 내릴 수 있도록 해주는 프로그래밍 가능한 신경망을 사용한다. 머신러닝이란? 데이터를 구문 분석하고 해당 데이터를 통해 학습한 후 정보를 바탕으로.. 2022. 9. 16.
Catboost란? 기존의 부스팅 기법 기존 부스팅 기법 동작 1. 실제 값들의 평균과 실제 값의 차이인 잔차(Residual)를 구한다. 2. 데이터로 이 잔차들을 학습하는 모델을 만든다. 3. 만든 모델로 예측하여, 예측 값에 Learning_rate를 곱해 실제 예측 값(평균 + 잔차 예측 값*lr) 을 업데이트한다. 4. 1~3 반복 문제점 1) 느린 학습 속도 배깅과 비교했을 때, 훨씬 느린 속도를 보인다. 배깅의 경우 여러 트리들이 병렬적으로 모델 학습을 수행하고 부스팅의 경우 순차적으로 모델 학습을 수행해나가니, 당연히 부스팅이 느릴 수밖에 없다. 2) 오버피팅 속도 문제는, 샘플링이나 알고리즘 최적화로 어느 정도 개선이 되었다면, 다음 진짜 문제는 오버 피팅이다. 부스팅이라는 개념 자체가 가지고 있는 문제인데.. 2022. 7. 21.
변수 선택 (Feature Selection) Feature Selection이란? 모델링 시 모든 feature를 사용하는 것은 매우 비효율적이기 때문에,일부 필요한 feature만 선택해서 사용할 수 있다. 필요한 변수만 선택해서 사용하기 위해 아래와 같은 방법이 있다. - Feature Engineering : 도메인 지식을 사용하여 데이터에서 피쳐를 변형/생성 - Feature Extraction : 차원축소(PCA)등 새로운 중요 피쳐를 추출 - Feature Selection : 기존 피쳐에서 원하는 피쳐만 (변경하지 않고) 선택 Feature Engineering은 데이터 피쳐를 어떻게 유용하게 만들것인가 Feature Selection은 데이터에서 유용한 피처를 어떻게 선택할 것인가 라고 생각할 수 있다. Feature Selectio.. 2021. 11. 8.
Pycaret을 사용한 데이터 분석 Pycaret pycaret이란 AutoML을 하게 해주는 파이썬 라이브러리이다. 기존에 있던 Scikit-learn, XGBoost, LightGBM, spaCy 등 여러가지 머신러닝 라이브러리를 ML High-Level API로 제작했다. 단 몇 줄로 데이터 분석 및 모델 성능 비교, Log를 생성까지 가능하다. AutoML(오토ML) 이란? 데이터 성격에 맞게 자동으로 데이터 분석 모델을 추천해주는 Auto Machine Learning 기법 AutoML(오토ML) 장점 인공지능 분석 모델을 학습하기 위해 데이터에서 중요한 특징(feature)을 선택하고 인코딩하는 방식에 대한 특징 엔지니어링(feature engineering) 자동으로 추출한다. 인공지능 모델 학습에 필요한 사람의 설정들, 하이.. 2021. 11. 1.