일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 인공지능
- 퍼셉트론
- 자료구조
- 파이썬 날코딩으로 알고 짜는 딥러닝
- 뇌를 자극하는 알고리즘
- 자료구조 알고리즘
- 선형 리스트
- 교차 엔트로피
- 파라미터
- 회귀분석
- 딥러닝
- lost function
- 확률분포
- 신경망
- 엔트로피
- DBMS
- 파이썬 딥러닝
- 노드
- 컴퓨터구조
- DB
- 단층퍼셉트론
- 딥러닝 교차엔트로피
- 순차 자료구조
- 자연어처리
- 연결 자료구조
- 리스트
- 편미분
- 오퍼랜드
- 딥러닝 교차 엔트로피
- 단층 퍼셉트론
- Today
- Total
목록전체 글 (121)
YZ ZONE
데이터가 많은 샘플들을 가지고 있는데 이것을 대표하는 정보를 어떻게 사용할 것이냐.가장 널리 쓰이는 방법에 평균과 분산이 있음. 평균: u=각각의 데이터(xi)의 값들을 다 더한 다음 개수만큼 나눔. 분산: 각각의 값에서 평균을 뺀 다음 제곱을 해서 값을 모두 더함. 그 다음 개수만큼 나눔. 분산에 제곱을 씌워주는것을 표준편차라고함. 공분산행렬 : i, j라는 인덱스가 있었을때 두개의 다른 특징들의 면화 양상을 뜻함. 한쪽의 특징이 커질때 다른쪽도 커지면 양수 반대면 음수를 가짐. 2.2.5 유용한 확률분포 가우시안 분포 가운데가 확률이 높고 가장자리로 갈수록 확률이 적어지는 형태를 정규분포를 따른다고 이야기하고 가우시안 분포가 정규분포를 표현하는데 가장 널리 사용되어지는 방법중의 하나이다. 높이가 평균..
2.2.3 최대 우도 일부분 또는 전체 매개변수(세타)를 모르는 경우 매개변수를 추정해야하는 상황. (최대우도추정을 함) 예제) (b)상황. x처럼 나오게 할 수 있는 최대 확률을 가지는 매게 변수를 추정 하는 문제. 기계학습에서 매게변수 파라미터라고 하는 정해지지 않은 것들이 많이 있음. 그런 것들의 값을 찾아 나갈때 확률을 기반으로 구할수도 있다.
2.2.2 베이즈 정리와 기계 학습 베이즈 정리 P(x|y)P(y)=**P(y|x)**P(x) 일때 P(x)를 넘겨주면 위와 같은 식이 나옴. ex) “하얀 공이 나왔다는 사실만 알고 어느 병에서 나왔는지 모르는데, 어느 병인지 추정하라”라는 질문을 아래와 같은 식으로 표현 가능. argmax는 P(y|x)의 확률 중 제일 큰 값을 y로 정하겠다 라는 말. 풀이 사전확률 : 사건이 일어나기 전의 확률. 하양이 나오기 전 어느병에서 나왔는가를 사전확률이라함.
2.2.1 확률기초 확률과 통계 기계 학습이 처리할 데이터는 불확실한 세상에서 발생하므로, 불확실성을 다루는 확률과 통계를 잘 활용해야함 확률변수 random variable : ex) 윷의 다섯 가지 경우가 도, 개, 걸, 윷, 모 다섯가지 경우 중 한 값을 갖는 확률변수를 x라고 할때 x의 정의역은 {도, 개, 걸, 윷, 모} 확률분포 각각의 확률이 얼만큼씩 나올 수 있는냐. 어떠한 확률이 얼만큼 분포하느냐 를 나타냄 -확률질량함수: 각각의 경우가 이산(끊어져 나누어있음)되어 있는 경우 -확률밀도함수: 각각의 경우가 연속되어있음 확률벡터 random vector 각각의 내용들이 얼만큼씩 나올 수 있느냐 확률을 벡터로 표현 예제) 주머니에서 번호를 뽑은 다음, 번호에 따라 해당 병에서 공을 뽑고 색을 ..
1.1자연어처리란 자연어(natural language): 사람들의 사회생활애서 자연스럽게 발생하여 쓰이는 언어 (한국어) 인공어: 자연어와 반대로 컴퓨터에게 명령을 하기 위해 만든 프로그래밍 언어 자연어처리(natural language processing, NLP): 컴퓨터가 자연어를 이해하고 생성할 수 있도록 자연어 이해(natural language understanding, NLU) :자연어 입력시 컴퓨터가 무슨 의미인지 알아듣는 과정 자연어 생성(natural language generation, NLG): 해당 의미를 언어로 생성하는 과정 1.2자연어처리의 응용 분야 전산언어학적인 활용 -기계번역(번역기) -음성인식(STT) -개인비서 서비스(siri, 빅스비 등) -날씨정보 요약 -인공지능..
데이터 data : 현실세계에서 관찰,측정해 수집한 사실이나 값 정보 information : 의사 결정에 유용하게 처리해 체계적으로 조직(가공)한 결과물 정보처리 information processing :데이터를 처리하여 필요한 정보를 추출 정보 시스템 IS Information System : 조직 운영에 필요한 데이터를 수집하여 저장해두었다가 의사결정이 필요할 때 처리해 유용한 정보를 만들어주는 수단 데이터베이스 DB : 특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장한 운영 데이터의 집합 -공유 데이터 -저장 데이터 -운영 데이터 -통합 데이터 integrated data: 중복 허용X. but 효율성 때문에 의도적으로 허용하기도 함. DB 특징 실시간 접근, 계속 변화(갱신..