본문 바로가기

ML/인공지능

(15)
이상감지 (정리) https://www.youtube.com/watch?v=xPA6JyHFHew 1. 이상치(Anomaly)란? 기존 관측과는 상이하여 다른 메커니즘에 의해 생성되었다고 판단할만한 관측값 2. 이상탐지 목적 기회 탐지 Chance Discovery (Positive Anomaly) : 새로운 이상치 탐지 오류 탐지 Fault Discovery (Negative Anomaly) : 노이즈 제거 3. 입력 데이터의 특성 (input data) Time series(sequential) vs static univariate vs multivariate data type (binarr / categorical / continuous / hybrid ) relational vs inddependent well-kn..
random forest // isolation forest 공부한한 내용 정리 1. random forest 의사결정 트리가 여러 개 모인 것. 하나의 의사결정 트리는 훈련 데이터에 오버 피팅되는 경향이 있다. 오버 피팅을 해결하기 위해 여러 개의 결정 트리를 모아 random forest가 나왔다. 1.1 동작 Bagging : training set의 부분집합을 활용하여 트리 형성 (각각의 부분집한의 인스턴스는 중복될 수 있다) bagging features : training set의 feature별로 트리를 형성한다. classiify : 2번에서 여러 개의 트리를 통해 ground truth(경계선)을 형성한다. 랜덤 포레스트가 생성한 일부 트리는 overfitting 될 수 있지만, 많은 수의 트리를 생성함으로써 overfitting이 예측하는 데 있어 큰 영향을 미치지..
RNN // LSTM 공부한 내용 제가 공부한것을 끄적인 내용입니다. 자세한 내용은 아래 링크를 참조하는게 더욱 좋습니다. 1. RNN Recurrent Neural Network 순환신경망 히든 노드가 directed cycle 형성 인공신경망의 종류 음성 / 문자등 순차적인 데이터에 적합 1.2 내부 구조 내부에 루프를 가진 네트워크 == 정보의 지속성 상황에 맞게 RNN을 붙여서 사용한다. 1.3 RNN의 내부 구조식 ht (히든 노드)= tanh ( 이전 히든 노드 + 현재 input + bh) yt (출력값) = ht(히든노드) + by 1.4. RNN의 장기 의존성 문제 (the problem of long term dependencies) 적절한 정보와 그 정보가 필요한 곳과의 차이(Gap)가 적을 경우 RNN은 과거 정보를..
신경 회로망 모델 파닥파닥~ 심심해서 다시 보는 신경망~ -_- 신경 회로망과 패턴 분류기와의 차이점 패턴 분류기는 심볼이 순차적으로 입력되며 내부의 계산 과정도 순차적으로 진행되어 내부에서 산술및 심볼 연산이 수행 된다. 분류기는 각 클래스의 일치 정도(matching score)를 계산한뒤 최대값을 갖는 클래스를 선택한다. 즉, 확률적 모델(probabilistic model)이 입력값과 가장 유사한 클래스 선택시 사용된다. 신경회로망에서는 첫번째 단계에서 n개의 이볅 연결을 통해 입력값이 병렬적으로 들어가서 병렬적으로 출력값을 다음 단계에 m개의 아날로그 선을 통해 전달한다.. 이때 최대값이 선택되어 확장된다. 두번쨰 단계에서는 각 m개 클래스에 대해 하나의 출력값만을 갖는다. 즉, 가장 일치도가 높은 클래스가 'h..
,,,,,,, 딱히 주제라 할수도 없는것이.. 우연히 신경망에 대해서 뒤적거리다가 잼잇는 그림을 발견했다. 내가 이것을 본 것은 드라마 카이스트 였따. 거기서 강성현이 싫어하는 교수님 밑으로 들어가서 논문을 쓰는 이야기 였는데. 논문 주제가 불확실성에서의 패턴 변화였나? 로 기억한다. 그것을 하면서 컴퓨터 화면에 띄운 화면이 저 화면 이었는데..우연히 저걸 인터넷에서 봐서 그 냥 퍼왓따;;ㅎㅎ 저번에 생각하다라는 주제로 글을 쓰다가 넘겼었는데.. 컴퓨터가 생각한다라는건 단순히 많은 경우중에서 빠른 길을 정해준다고 생각한다. "이순신 장군의 발 싸이즈는 몇일까요?" -_-당근 모른다. 뭐 키가 9척이니 그에 따른 몸무게를 지탱해야하고 대충의 체격이 나오니 이 정도 될것이다~ -0- 그건 퍼지고.. 우리들은 0.5초만에 ..
이놈의 AI, 생각한다라는건 뭘까? -이번 컬럼은 저의 생각이지 문서의 도용이나 참조하지 않았음을 명시합니다. (정확하지 않습니다.) 난 AI를 가르치는 교수가 시러서 한번도 AI 수업을 받지 못했다..(안받았다.) 그래서 AI라는 개념을 책에서 읽었을땐 꽤나 충격이었다. 정말 코딩만 하면 알아서 할줄알았다. 그래서 왜 컴퓨터가 개발된지 100년가까이 됐어도 사람 과 비슷한 지능을 가지지 않았나 의구심이 많았었다. 정말 AI는 간단한거 같다. 지식이란뭘까? 지식 = "정보 + 데이터 + 경험" 이다. 정보란 뭘까? 정보 = "데이터 + 데이터" 이다. 메타데이터 끼리의 조합에서 새로운 데이터를 생성하고(SQL의 쿼리문도 정보라 할수 잇는것이다.) 정보와 새로운 테이터 or 경험(난 경험이란 데이터의 총집합이라 생각한다.) 로 새로운 지식을..
인공지능...두둥!! -_-말그대로..두둥이다. 수업 과제로 프로젝트가 나왔는데.. 내가 한다고 했떤것이.. 뉴런 or 유전 알고리즘이다. 교수가 싫어서 수업을 피해다녔는데..이렇게 인공지능하고 대면을 하게 되었구나. 이제 부터 인공지능 칼럼을 만들까 한다.. 공부하는거나 끄적거릴꼄.. 내가 가장 흥미 있게 봤었떤 네셔널지오그래픽 채널 무인 자동차 경주 2007년 우승차