본문 바로가기

전체 글

(1145)
1. vector embedding 이란? Abstract: 자연어 처리 분야에서 많은 관심을 받고 있는 Vector Embedding 기술이 챗봇 개발에 어떻게 적용되고 있는지에 대해 탐구합니다. 이 글에서는 챗봇이 대화 상대와의 의미 있는 상호 작용을 달성하기 위해 텍스트를 벡터 공간으로 변환하는 방법과 그것이 어떻게 챗봇의 성능 향상에 기여하는지에 대해 다룰 것입니다. 또한, 다양한 벡터 임베딩 기술과 그 활용 사례들을 살펴보며, 이를 통해 챗봇의 자연스러운 대화 능력 향상에 어떻게 기여할 수 있는지를 분석합니다. 1.1 벡터 임베딩이란? 챗봇의 가장 중요한 기능은 바로 사용자가 입력한 문장의 의미를 알아야 하는것입니다. 검색이라면 단순히 검색어가 일치한 것을 찾아내면 되지만 채팅이기 때문에 사용자의 문맥의 의미를 알아야 합니다. 사용자가 ..
llama2 / mistral fine tuning (with autotrain) llama2과 mistral 모델의 가장 큰 특징은 오픈소스라는 점이다. 누구나 모델을 자유롭게 사용할 수 있으며 상업용으로도 사용할 수 있다. 먼저 fine tuning의 가장 큰 목적은 자신만의 도메인을 답하게 하기 위함이 크다. 물론 RAG를 통해서도 가능 하겠지만, 정확한 답변을 요구하는 RAG와 다르게 fine tuning을 통해서는 답변을 원하는 형태로 바꾼다는 표현이 더 정확할꺼 같다. ex : 다음 문장을 사투리로 바꿔줘 물론 둘다 하는 방법도 있지만, 보통 RAG / fine tuning 하나만을 추천한다. (둘다 사용해도 드라마틱하게 성능이 향상되진 않는다고 한다.) 파인튜닝은 다음의 단계를 고려해야 합니다. 1. Fine-tuning 선택 초기에는 어떤 부분을 개선하거나 변경할지 결정..
3. 각 회사별 MLops 각 회사들의 블로그에서 발췌한 내용들 입니다. 국내외 주요 기업들의 MLOps 사례를 통해 효과적으로 MLOps를 구현하는 방법을 생각해보셨으면 합니다. MLops구현시 다음을 중점적으로 구현해보면 됩니다. 목표: MLOps를 통해 달성하고자 하는 목표는 무엇입니까? 전략: MLOps를 어떻게 구현하고 있습니까? 성과: MLOps는 어떤 성과를 거두었습니까? 와디즈 (추천시스템) https://blog.wadiz.kr/prophet%ec%9d%84-%ec%9d%b4%ec%9a%a9%ed%95%98%ec%97%ac-%ec%9b%94%ea%b0%84-%ed%8e%80%eb%94%a9-%ea%b8%88%ec%95%a1-%ec%98%88%ec%b8%a1%ed%95%98%ea%b8%b0/ 라인 https://te..
2. MLops 아키텍처 CI/CD는 소프트웨어 개발의 효율성과 안정성을 향상시키는 데 중요한 역할을 합니다. CI를 통해 개발자는 코드를 작성하자마자 즉시 통합하여, 버그를 조기에 발견하고, 품질을 높이는 데 도움이 됩니다. CD를 통해 개발자는 통합된 코드를 테스트 및 배포하여, 소프트웨어를 안정적으로 제공할 수 있습니다. MLOps와 DevOps는 모두 소프트웨어 개발과 운영의 효율성과 안정성을 향상시키는 것을 목표로 하지만, 그 초점은 다릅니다. DevOps는 소프트웨어의 개발, 배포, 운영 전반에 걸쳐 협업과 자동화를 강조한다면, MLOps는 머신러닝 모델의 데이터, 개발, 배포, 운영에 초점을 맞춥니다. 데이터 관리: 머신러닝 모델을 학습시키기 위해서는 고품질의 데이터가 필요합니다. MLOps는 데이터 관리를 통해 데..
1. MLops 이란? 머신러닝(ML)은 다양한 분야에서 빠르게 확산되고 있습니다. 하지만 ML 모델을 개발하고 프로덕션 환경에 배포하는 것은 쉽지 않은 일입니다. MLOps는 이러한 문제를 해결하기 위한 일련의 방법론과 도구를 제공합니다. 1. MLOps란? MLOps는 머신러닝(ML)과 운영(Ops)의 합성어로, ML 모델을 개발하고 프로덕션 환경에 배포하는 모든 프로세스를 포괄하는 개념입니다. MLOps는 ML 모델의 개발, 배포, 운영의 전 과정을 자동화하고 통합함으로써 ML 모델의 효율성과 안정성을 향상시키는 것을 목표로 합니다. 2. MLOps의 필요성 ML 모델을 개발하는 것은 데이터 수집, 데이터 준비, 모델 학습, 모델 평가 등의 복잡한 과정을 거쳐야 합니다. 또한, 개발된 모델을 프로덕션 환경에 배포하고 운영..
나의 ML 수학 + 기초 공부 (계속 진행중) 회사에서의 업무가 데이터 관리 + MLops + 모델 학습까지 하기 때문에 ML 공부도 꾸준히 하고 있었다. 여기에는 그동안 수학 + ML 공부를 한 유툽을 기록한다. (MLops관련은 따로 포스팅 하도록 하겠다) 수학 (선형대수학) https://www.youtube.com/playlist?list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab Essence of linear algebra A free course offering the core concept of linear algebra with a visuals-first approach. www.youtube.com 논문 읽기 https://www.youtube.com/@dsba2979/videos 고려대학교 산업경영공학부 DS..
나의 ML 수학 공부 - 완전 기초부터 (진행중) 나의 업무가 ML 모델쪽이 되어 버렸다.. 사실 책과 인터넷을 보면서 모델은 만들 수 있는데, 논문을 보면 정확히 이게 왜 쓰이는지 알수가 없었다. (그냥 좋아서 쓰나? 하면서 넘어갔다. 블로그 글에 수학이 나오면 무슨 이야기 인지 몰라 그냥 넘겼다) ML의 근본 내용을 알기 위해선 수학이 필요하다고 생각해서, 수학 공부를 시작했다. 1. 대수학 https://www.udemy.com/course/algebra-master/ 일단 방정식의 기본 개념부터 잡고 시작하기. (할인 할때 사자! 만오천원에 살 수 있다) 선형대수학이 아님!! 대수학이다. 위의 강좌를 끝마치고 ebs의 관련 강좌를 봤다. (위의 강좌에서는 문제가 많이 없어서 ebs를 보면서 문제를 다시 풀었다) https://mid.ebs.co...
hanspell 오류 JSONDecodeError: Expecting value; line1 column 1(char0) (23-04-07 업데이트) 네이버 맞춤법 검사기를 해당 패키지가 사용중이지만, 계속 바뀌고 있는 중인거 같다. https://github.com/ssut/py-hanspell/issues/31#issuecomment-1499111284 JSONDecodeError: Expecting value; line1 column 1(char0) 오류 · Issue #31 · ssut/py-hanspell 안녕하세요. 기존에 hanspell을 사용하여 프로젝트를 하고 있는 컴퓨터공학과 학생입니다. 다름이 아니라, 며칠 전까지만 해도 오류 없이 잘 실행되던 코드가 제목과 같이 오류가 생성되어 이렇게 github.com 여기 이슈를 확인하고 수정하길 바랍니다. 아래 글은 참조하지 마세요!!!!!!!!!!!!!!! ==..