전체 글

· FastAPI
FastAPI에서 사용되는 Pydantic 2.5버전튜토리얼을 살펴봐주세요! Pydantic setting은 환경 변수 혹은 비밀로 설정해야할 것들 또는 구성 클래스를 로드하기 위해 pydantic기능들을 제공하고 있는데요. 저는 이 기능은 openAPI키를 숨기기위해 기능을 사용했는데요. 사용방법을 아래에서 살펴보도록 하시죠~ # pydantic-setting install 일단 pydantic-setting을 깔아야해요! 간단하게 pip install로 깔아주세요~ pip install pydantic-settings # SettingsConfigDict를 활용해 .env파일 불러오기 저는 main.py와 같은 위치에 .env파일을 만들고 .env파일에 숨겨져야하는 openai_api_key를 이렇게..
안녕하세요 2023년 음성인식 중 가장 성능이 좋다고 알려진 일명 "whisper"라는 논문에 대해서 살펴보겠습니다. 현재 음성인식은 whisper를 base로 한 변형된 여러 모델들이 계속 나오고 있습니다! 변형된 모델을 살펴보기 전에 base가 되는 whisper모델은 어떤 모델인지 먼저 살펴보고 변형된 모델들에 대해서도 살펴보겠습니다! 음성인식이라는 것은 발화가 있는 오디오 데이터를 발화 그대로 text로 써주는 기술이죠! Speech to Text. 줄여서 STT라고 부릅니다. whisper는 광범위한 오디오 샘플에 대해 광범위하게 훈련된 다목적 음성 인식 모델입니다. 다국어 음성 인식, 음성 번역, 언어 식별등 여러 작업을 처리할 수 있는 멀티태스킹 모델입니다. #1. whisper 소개 기존 ..
여러분 안녕하세요! 이번 포스팅에서는 windows에서 wsl2를 활용해서 linux사용할 수 있는 환경을 만들어볼거에요~ 저도 초보자이기 때문에 아래 블로그를 잘 따라오시면 여러분들도 금방 따라오실 수가 있습니다! 그러면 Step별로 한번 따라가보겠습니다! 제가 window에 linux를 사용해야하겠다고 생각한 계기가 인공지능 프로젝트를 하고 있는데, 제가 사용하는 모델이 오직 Ampere GPUs만 지원이 된다는거에요!!!!!! Colab에서 돌리고 있었는데 이 모델 돌리자고 pro로 업그레이드해서 A100사용하긴 부담이고, 맥북은 m1이라 안돌아가고... 마지막 데스크탑에만 rtx3090이 깔려 있어서 이걸로 시도를 해볼 수 있을 것 같은데.. 최악의 window환경이랍니다. window는 터미널 ..
· Github
새로운 branch만들 때 - git checkout -b repository에 commit 할때 git add . # git에 수정사항 업로드 git status # 수정된 파일 미리보기 git commit -m "commint 내용쓰기" # commit 쓰기 git push origin 현 pr에서 제거할 때 git rm --cached -rf . git add . git commit -m "{커밋 메시지 입력}"
· LLM
chatGPT를 사용하기 위해서는 우선 API키를 발급받아야합니다. 다들 아시겠지만, chatGPT는 openAI에서 만들어진 제품이죠! 검색을 통해 openAPI홈페이지로 접속해봅시다! 1. OpenAI홈페이지 접속 https://openai.com/ OpenAI Watch OpenAI DevDay Keynote on Monday, November 6 at 10am openai.com 2. Log in후 API 페이지로 이동 오른쪽 상단에 LOG in 이 있으실 거에요 그 버튼을 클릭하시면 어떤 제품을 사용할 건지 클릭하실수가 있는데, 우리는 API를 발급받을거니까 제일 오른쪽에있는 API를 클릭해서 API를 받으러 가보겠습니다. API버튼을 누르시고 Welcome to OpenAI platform이라..
· Audio
생성형 AI를 체험해볼 수 있는 사이트가 있어서 소개해드리려고 합니다~! 바로 아래 사이트인데요! 회원가입하고 로그인을 해야지만 무료로 체험이 가능한 것 같아요! 그래서 체험해보고싶으신분들은 회원가입하시고 사용하시면 될 것 같습니다! 로그인하시면 바로 아래와 같은 화면이 나오실 텐데요! 여기서는 Speech Synthesis의 결과를 나타나기 위한 여러 셋팅들을 조절할 수 있습니다! 어떤 사람이 말하는지 어떤 톤으로 말하는지 그리고 언어 선택까지~~!! 사람의 목소리를 선택할 수 있습니다! 저는 Patrick을 선택했는데요. 미국사람이고 소리지르는 듯한 목소리를 낸다고 하네요~! 사람 목록에는 여러 목소리를 내는 선택지들이 있어요! 여러분의 취향에 맞는 사람을 선택해봅시다~ 그리고 그 밑에는 Voice ..
· Audio
23년 11월 2일 따끈따끈한 뉴 모델이 나왔습니다! 아래 github에서 보실 수 있습니다! 아래의 글은 아래 github링크에 있는 글을 한글로 번역한 포스팅입니다! github : https://github.com/huggingface/distil-whisper GitHub - huggingface/distil-whisper Contribute to huggingface/distil-whisper development by creating an account on GitHub. github.com 아쉽게도 한국어에도 특화된 모델은 아니고 영어 ASR버전이라 영어에 특화된 모습입니다. 이전 whisper모델은 한국어 연구자님이 공동 연구를 하여 훈련데이터셋에 한국어도 들어가서 한국어에서도 높은 성능을..
터미널에서 간단하게 numpy 버전을 확인하는 방법에 대해 알아보겠습니다. # 1. __version__ 함수를 사용해 numpy 버전 찾기 1. numpy 모듈을 import해주세요. 2. 모듈의 속성인 __version__을 확인해주시면 버전 체크가 가능합니다 import numpy as np print(np.__version__) # 1.26.1 터미널 사용시 예시 ) 1. python 입력 후 python 모드로 들어갑니다. 2. numpy 모듈 import 한 후, numpy의 별칭은 np로 지정해줍니다. 3. 별칭(np)을 부르면 numpy 모듈이 불러와집니다. 4. np.__version___ 을 출력해주면, numpy 모듈 안에 __version__속성이 불러와집니다. 5. numpy 버전..
리미에오
리미에오 기록저장소