전체 글

설치하기 curl -sSL https://install.python-poetry.org | python3 - poetry --version 를 입력하면 command not found: poetry 가 응답할 것이다. poetry 설치과정에서는 우리의 command shell에 PATH를 자동으로 세팅해주는 과정이 없다. 그래서 본인이 사용하는 command shell에 알아서 PATH를 추가해야 한다. 1. 현재 쉘에만 추가 export PATH="$HOME/.local/bin:$PATH" 2. 영구적으로 추가 sudo vi ~/.bashrc 명령어 입력 후 맨 하단에 PATH 추가 PATH="$HOME/.local/bin:$PATH" esc누르고 :wq!로 저장하고 종료 그 후, source ~/.b..
지난 포스팅에서 K-Nearest Neighbor과는 다르게, Linear Classifier는 W값만으로 predict가 가능하다는 장점과, 더 정확한 정보를 얻을 수 있다는 것이 장점이었습니다. f(x, W) = W*x+b라는 식으로, (CIFAR-10 기준으로) 10가지의 카테고리당 점수를 알 수 있었습니다. 고양이, 자동차, 개구리, 사진아래에는 Weight값들을 사진으로 나타내어, Linear Classifier가 알아낸 카테고리의 특징을 알아볼 수 있습니다. 이 사진은, w값이 랜덤이기에 일어나는 상황이라고 하였죠. 자동차를 제외한 두 가지 카테고리의 점수는 정답을 거의 맞히지 못하는 상황입니다. 그리고, w값이 랜덤이라는 점에서부터, 도대체 w값을 어떻게 바꾸어 나가야 제대로 된 점수를 얻을..
이번 포스팅에서는 이전 장에 이어 stanford univ. cs231n 2강의 뒷 부분에 대해 포스팅해보려고 합니다. 뒷부분의 내용은 linear classifier, softmax, svm에 대한 내용들로 이루어져 있습니다~ 제가 이 내용들을 최대한 쉽게 풀어서 설명해보겠습니다. # Linear Classifier 2강 (1)번포스팅에서는 knn으로 이미지 분류방법을 소개했는데, 이번에는 knn이 아닌 다른 이미지 분류 기법으로 선형 분류기와 신경망 모델에 대해 살펴보겠습니다. 신경망(Neural Network) 모델은 선형 분류기들을 층(Layer)으로 연결한 것이라고 할 수 있습니다. 선형 분류기(Linear Classifier)는 주어진 데이터를 가장 잘 분류하는 선형 함수를 구하여, 새로운 입..
선형시스템(linear system)이란 해당 시스템의 수학적 모형이 선형 연산을 기본으로 한 시스템을 말합니다. 어떠한 시스템의 모델이 하나의 미분방정식으로 표기될 때, 그 계수가 상수거나 혹은 독립변수만의 함수라면 그 미분방정식은 선형입니다. '선형적이다' 라는 표현은 영어로 linear하다 라고 말합니다. linear란 line(선)의 형용사 형태입니다. 이 말에서 유추할 수 있듯이 선형적이라는 것은 어떤 성질이 변하는데 그 변수가 1차원적이다. 즉 어떤 신호에 기울기만 곱한 형태와 같다는 것입니다. 실제로 완전한 선형적인 시스템을 구현하기 위해서는 기울기(a)만 있고 상수항(b)이 없어도 되지만, 많은 경우 고정된 상수항이 있다면 그것은 예측가능한 부분이기 때문에 굳이 비선형적이라고는 하지 않습니..
standford cs231n 2023년 버전으로 작성했습니다. 틀린 내용이 있으면 댓글로 남겨주세요~chapter2에서는 conputer vision의 핵심분야이고, 1. The image classification task와 2. Image classification을 두 가지의 기초적인 data-driven approaches로 배우게 됩니다. 그 중 하나는 k-nearest neighbor이고 또 하나는 linear classifier을 배우게 됩니다. Image Classification : A core task in Computer Vision 컴퓨터 비전에서 가장 중요한 것은 이미지 분류입니다. 이미지 분류(Image classification)란, 어떤 사진을 보았을 때, 그 사진들이 어떤..
안녕하세요. 이번에는 LangChain을 활용해서 문서를 분할 할 수 있는 여러가지 TextSplitter에 대해 살펴보겠습니다. 현 포스팅 이후에 업데이트되어 새로 추가되는 내용들은 댓글에 남겨주시면 감사하겠습니다 :) 텍스트 분할기는 종종 문장에 해당하는 의미론적 의미를 지닌 작은 조각으로 텍스트를 나누는 도구입니다. 이 텍스트 분할기가 중요한 이유는 LLM모델마다 max token의 수가 다르기 때문입니다. 그래서 텍스트 분할기를 통해 모델에 들어가는 토큰수를 제한해주어야하는데 이때 TextSplitter가 중요한 역할을 합니다. chatGPT 3.5 API의 최대 토큰수는 4096이기 때문에 chunk 크기를 4000으로 잘라줘도 되지만, 그렇게되면 효율적이지 못하기 때문에 2000정도로 잘라주게..
안녕하세요. 현재 chatGPT의 뛰어난 성능으로 LLM, LangChain, RAG등 여러 요소들이 주목받기 시작했습니다. 사실 RAG는 chatGPT가 주목받기 전부터 자연어처리분야에서 종종 쓰이던 기술이였는데요. RAG는 자연어처리 분야에서도 QA, MRC분야 특히 ODQA분야에서 주목을 받던 기술입니다. RAG의 풀 네임은 Retrieval Augmented Generation인데요. 2020년 NeurlPs에 Accept이 되면서 주목을 받기 시작했습니다. 사실 RAG는 2021년 모 부트캠프에서 MRC에 대한 논문 흐름을 이야기하는 세미나를 했었는데요. MRC흐름을 공부하느라 RAG를 언급하고 공부했던 기억이 나는데, 다시금 2023년에 엄청난 주목을 받으니 새삼 신기하더라구요. RAG의 구조..
· LLM
코파일럿은 현대적인 AI를 사용하고 대화 인터페이스를 갖춘 응용 프로그램으로, 사용자의 작업을 돕는 것이 목표입니다. GitHub Copilot으로 시작하여 몇 년 동안 다양한 Copilot들을 구축하는 과정에서 우리가 알아차린 것은 Copilot들을 만드는 과정의 공통점을 찾아내어 사용자 경험을 설계하고, 안전하고 책임감 있게, 비용 효율적으로 접근할 수 있는 기술 스택을 고안해야 한다는 것입니다. 우리는 시간과 노력을 들여 Copilot기술 스택을 설계했고, 이것은 많은 Copilot제품을 사용자에게 빠르게 제공할 수 있었던 유일한 이유가 되었습니다. - Era of Copilot, MS Build # Copilot stack # Copilot frontend # Orchestration framew..
리미에오
리미에오 기록저장소