국비 교육/머신러닝, 딥러닝37 [머신러닝] DBSCAN 기상청 빅데이터 콘테스트를 참가하게 되며 결과 해석으로 DBSCAN을 사용했다.그때 당시에는 DBSCAN 에 대해 잘 알지 못해 적어보려 한다. DBSCAN# default 값 적어둠DBSCAN(eps=0.5, min_samples=5, metric='euclidean', metric_params=None, algorithm='auto',leaf_size=30, p=None, n_jobs=None)- 서로 인접한 데이터들은 같은 클러스터 일 것이라는 아이디어에서 착안되었다.- 클러스터를 밀도가 높은 영역으로 보고 밀도가 낮은 영역으로 구분한다. 클러스터는 각각 서로 가까운 코어 샘플의 집합이며 코어 샘플에 가까운 비핵심 샘플의 집합이지만, 그 자체는 아니다.- 특정 데이터를 중심으로 밀도가 .. 2024. 8. 6. [머신러닝] 상관분석 - 변수 간의 관계 (선형, 비선형) 상관분석(Correlation Analysis)연속 변수로 측정된 두 변수간의 선형 관계를 분석하는 기법으로,한 변수가 증가하면 다른 한 변수도 선형적으로 증가 혹은 감소하는지를 나타낸 것이다.상관계수 (Correlation Coefficient)두 변수 사이의 선형적인 관계 정도를 나타낸다. 계수는 상관관계 보고서에서 r로 기호화한다.상관 계수 r은 -1과 1 사이의, 단위가 없는 값이다. 통계 유의성은 p-값으로 표기합니다. 따라서 상관관계는 보통 2개의 핵심 숫자인 r = 과 p = 로 표현한다.값은 -1에서 1 사이의 값을 가지며, -1에 가까울 수록 두 변수가 음의 상관관계를,1에 가까울 수록 두 변수가 양의 상관관계를 갖는다는 것을 의미합니다.r = 0에 근접할 수록 선형관계가 약해진다. 이를.. 2024. 8. 6. [딥러닝] RNN 순환 신경망 RNN 순환 신경망 (Recurrent Neural Network)- 음성, 동영상, 주식 시세와 같은 시간의 흐름이 있는 Sequence(시계열) 데이터를 다루는 신경망이다.활용- 자율 주행 차량의 궤적을 예측, 이미지나 비디오의 캡셔닝, 고정길이 보다 임의의 길이의 시퀀스를 다룰 때, NPL (Natural Language Processing) 처리 - 음성인식, 변역- 인식이 아닌 이미지 설명하며 주어진 이미지를 문장을 통해 설명한다. 이미지 인식이나 분류보다 더 어려운 문제이다.- 현재 단계의 정보다 다음 단계에 전달되어 output 에 영향을 주는 것이 핵심- 순환 신경망은 다중 퍼셉트론과 비슷하지만 은닉층 사이가 순환 가중치(Recurrent weight)로 연결된다.- Recurrent :.. 2024. 8. 1. [딥러닝] 활성화함수, 출력함수, 손실함수, 최적화함수 활성화 함수- Activation 함수뉴런의 가중치 합을 다음 층으로 전달 시 활성화를 할지 말지 결정.뉴런의 가중합의 값이 충분하지 않으면 활성화 함수는 다음 층에 0에 가까운 값 또는 그 이하의 값을 전달한다.활성화 함수로는 비선형 함수를 이용하는데, 이는 심층 신경망을 통해 선형 분류 또는 풀기 어려운 문제(= 비선형 문제)를 풀기 위해서이다.함수 종류softmax, elu, softplus, relu, tanh, sigimoid, hard_sigmoid, exponential, linear 등Hidden Layer 의 활성화 함수종류내용식시그모이드 함수exp 연산 때문에 연산 속도가 느리다.y = 1 / ( 1 - exp(-x) 하이퍼볼릭탄젠트 함수출력값이 0을 기준으로 대칭하여 학습속도가 시그모.. 2024. 8. 1. [딥러닝] DNN 심층신경망 DNN 심층 신경망 (Deep Neural Network)인공 신경망을 기반으로 은닉층이 2개 이상인 신경망 학습 알고리즘복잡하고 표현력 높은 모델을 구축하기 위해 입력계층과 출력 계층 사이에 복수개의 은닉계층으로 이뤄져 있는 것이다.- 입력 계층 : 신경망에서 데이터를 입력받는 계층- 은닉 계층 : 입력 계층과 출력 계층 사이에서 하나 이상 존재하는 계층- 출력 계층 : 결과 값을 만들어내는 계층 신경망 모형 학습 절차활성화 함수- 가중합에 대해 다음 층으로 데이터 전달 시 활성화 할지 말지를 결정한다.- 종류에 따라 다르지만, 가중합의 값이 충분하지 않으면 활성화 함수는 다음 층에 0에 가까운 값 또는 그 이하의 값을 전달한다.- 비선형 함수를 사용하는데 이는 심층 신경망을 통해 선형 분류로는 풀기 .. 2024. 8. 1. [딥러닝 - 교육 외] DNN - [실습] Heart Disease 데이터 셋https://www.kaggle.com/datasets/johnsmith88/heart-disease-dataset Heart Disease DatasetPublic Health Datasetwww.kaggle.com 패키지 로딩import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# from keras.models import Squentialfrom tensorflow.keras import Sequentialfrom keras.layers import Densefrom keras.callbacks import EarlyStoppingfrom sklearn.model_selection import train_test_spl.. 2024. 8. 1. 이전 1 2 3 4 ··· 7 다음