머신러닝 & 딥러닝 79

[머신러닝/딥러닝 기초] 5. 퍼셉트론(Perceptron) 이론과 간단 구현 - 2 퍼셉트론 이론과 간단 구현 - 1 https://seokii.tistory.com/54?category=1054781 4. 퍼셉트론(Perceptron) 이론과 간단구현 - 1 지난 포스팅 https://seokii.tistory.com/52 3. 머신러닝을 하면서 주의해야 할 6가지 머신러닝 시스템의 종류 https://seokii.tistory.com/49 2. 머신러닝 시스템의 종류 머신러닝이란 https://seokii.tistory.co.. seokii.tistory.com 지난 글에서 퍼셉트론 이론을 정리하고 퍼셉트론을 이용해서 AND 게이트를 구현했습니다. 글을 이어서 마저 정리해보도록 하겠습니다. 가중치와 편향 \begin{cases}0\left( w_{1}x_{1}+w_{2}x_{2}\l.. 머신러닝 & 딥러닝/기초 이론 2022. 2. 9.
[머신러닝/딥러닝 기초] 4. 퍼셉트론(Perceptron) 이론과 간단 구현 - 1 지난 포스팅 https://seokii.tistory.com/52 3. 머신러닝을 하면서 주의해야 할 6가지 머신러닝 시스템의 종류 https://seokii.tistory.com/49 2. 머신러닝 시스템의 종류 머신러닝이란 https://seokii.tistory.com/48?category=1054781 1. 머신러닝(Machine Learning, 기계학습)이란 무엇인가? 머신.. seokii.tistory.com 저번 글에서는 머신러닝을 공부하고 진행하면서 주의해야 할 점들에 대해서 정리했습니다. 이번 글에서는 퍼셉트론이 무엇인지에 대해 정리하고 간단한 구현을 통해 실습하겠습니다. 퍼셉트론이란? 퍼셉트론은 프랑크 로젠블라트(Frank Rosenblatt)가 1957년에 고안한 알고리즘입니다. 퍼.. 머신러닝 & 딥러닝/기초 이론 2022. 2. 9.
[머신러닝/딥러닝 기초] 3. 머신러닝을 하면서 주의해야 할 6가지 머신러닝 시스템의 종류 https://seokii.tistory.com/49 2. 머신러닝 시스템의 종류 머신러닝이란 https://seokii.tistory.com/48?category=1054781 1. 머신러닝(Machine Learning, 기계학습)이란 무엇인가? 머신러닝(기계학습)과 딥러닝에 대해 공부하다가, 남들에게 설명할 수 있을 만큼 기초 이.. seokii.tistory.com 지난 글에서 머신러닝 시스템의 종류에 대해 정리했습니다. 주의해야 할 6가지 적은 양의 훈련 데이터 기본적으로 대부분의 머신러닝 알고리즘이 잘 작동하려면 데이터가 많아야 합니다. 아주 간단한 문제에서조차도 수천 개의 데이터가 필요하고 이미지나 음성 인식 같은 복잡한 문제라면 수백만 개가 필요할지도 모릅니다. 따라.. 머신러닝 & 딥러닝/기초 이론 2022. 2. 9.
[머신러닝/딥러닝 기초] 2. 머신러닝 시스템의 종류 머신러닝이란 https://seokii.tistory.com/48?category=1054781 1. 머신러닝(Machine Learning, 기계학습)이란 무엇인가? 머신러닝(기계학습)과 딥러닝에 대해 공부하다가, 남들에게 설명할 수 있을 만큼 기초 이론에 대한 복습이 필요하다고 생각되어 차근차근 글을 올려보려고 합니다. 머신러닝(기계학습)이란? 기 seokii.tistory.com 지난 글에서 머신러닝의 개념과 사용하는 이유에 대해 작성을 했습니다. 이번에는 머신러닝 시스템의 종류에 대해서 정리하도록 하겠습니다. 머신러닝 시스템의 종류 머신러닝은 크게 지도학습, 비지도학습, 강화학습 세 가지 종류로 나눌 수 있습니다. 지도학습 지도학습(Supervised Learning)은 답이 있는 데이터를 사용해.. 머신러닝 & 딥러닝/기초 이론 2022. 2. 8.
[머신러닝/딥러닝 기초] 1. 머신러닝(Machine Learning, 기계학습)이란 무엇인가? 머신러닝(기계학습)과 딥러닝에 대해 공부하다가, 남들에게 설명할 수 있을 만큼 기초 이론에 대한 복습이 필요하다고 생각되어 차근차근 글을 올려보려고 합니다. 머신러닝(기계학습)이란? 기본서와 백과사전에는 항상 기계학습에 대해 아서 사무엘(Arthur Samuel, 1959)의 말을 인용합니다. "머신러닝은 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다." 이 말을 그대로 받아들이면 이해가 어렵지 않다고 생각합니다. 기계학습은 여러 종류의 데이터들로부터 컴퓨터가 학습할 수 있도록 프로그래밍하는 과학이라고 정의할 수 있습니다. 머신러닝을 왜 사용할까? 머신러닝을 사용하면 이미지, 텍스트, 음성 등의 데이터들을 사용해 여러 가지 작업을 할 수 있습니다. 간단하게는 텍스트를 분석해 .. 머신러닝 & 딥러닝/기초 이론 2022. 2. 8.
NLP 기초 - KoNLPy를 활용한 한국어 형태소 토크나이징(Komoran, Kkma, Okt) 토크나이징(tokenizing) 일반적으로, 자연어 처리를 하기 위해서는 문장을 일정 의미를 지닌 작은 단어들로 나누어야 합니다. 가장 기본이 되는 단어를 토큰(token)이라 합니다. 말뭉치(혹은 문장)가 주어졌을 때, 이러한 토큰 단위로 나누는 작업을 토크나이징(tokenizing)이라고 합니다. 주로 텍스트 전처리 과정에서 사용되고, 이 과정에 따라 성능 차이가 날 수 있습니다. 한국어 토크나이징? 띄어쓰기와 단어의 변화가 적은 영어와 달리, 한국어는 문법적으로 복잡하고 한국어 토크나이징을 구현하기 위해서는 한국어 문법에 대해 깊이 있는 이해력이 필요합니다. 하지만, 이 기능을 지원하는 라이브러리가 존재하며 이를 사용해 한국어를 토크나이징 해보도록 하겠습니다. 형태소를 토큰 단위로 쓰며, 형태소는 .. 머신러닝 & 딥러닝/자연어처리 2021. 12. 3.
자연어처리(NLP)에 쓰이는 13가지 기초 용어 알아보기 자연어처리(NLP)에서 쓰이는 기초 용어들을 정리했습니다. 자연어 공부를 시작하면서 기초적인 용어부터 공부하고 있습니다. 기초 용어만 잘 숙지해도 앞으로의 공부 내용에 이해가 잘 될 것 같아 정리했습니다. 자연어처리(NLP) 기초 용어 1. 말뭉치(Corpus) : NLP작업에서 의미하는 텍스트 데이터 일반적으로 원시 텍스트와 연관된 메타데이터를 포함 2. 토큰(token) : 문법적으로 더이상 나눌수 없는 요소를 토큰이라 함 3. 토큰화(tokenization) : 토큰화는 주어진 말뭉치(텍스트)에서 토큰 단위로 나누는 작업을 의미함 4. 메타데이터(metadata) : 식별자, 레이블, 타임스탬프 등 텍스트와 관련된 어떤 부가 정보도 메타데이터가 될 수 있음. 메타데이터가 붙은 텍스트를 샘플(samp.. 머신러닝 & 딥러닝/자연어처리 2021. 11. 29.
파이토치 기초 텐서(Tensor) 인덱싱, 슬라이싱, 합치기(연결) - torch.index_select(), cat(), stack() 이번에는 텐서(Tensor) 인덱싱, 슬라이싱, 합치기를 알아보겠습니다. 주피터 노트북으로 실습하기 In [1] : import torch def describe(x): print("타입: {}".format(x.type())) print("크기: {}".format(x.shape)) print("값: \n{}".format(x)) - 라이브러리를 불러옵니다. - 결과 확인을 위한 간단한 함수를 정의합니다. In [2] : x = torch.arange(9).view(3,3) describe(x) - 실습을 위해서 .arange() 함수와 .view()함수를 사용해 3*3 텐서를 만듭니다. In [3] : describe(x[:2, :3]) In [4] : describe(x[1, 2]) - x[:2, .. 머신러닝 & 딥러닝/자연어처리 2021. 11. 28.