본문 바로가기

분류 전체보기30

[CS] gensim ImportError 1. 가상 환경 생성2. 문제 발생 및 해결 과정 오늘은 패스트캠퍼스 강의 영상을 보며 공부하다가 gensim 패키지를 설치하면서 발생했던 ImportError 와 해결과정에 대해 다뤄보도록 하겠습니다. 1. 가상 환경 생성vscode 환경에서 진행했는데 평소에는 "python -m venv" 명령어를 사용하여 가상 환경을 만들었지만, 최근에 강의를 통해 conda를 사용하여 가상 환경을 만드는 방법을 배웠습니다. 강의에서는 "conda create -n 가상 환경 디렉토리명 python=버전" 명령어를 사용하여 가상 환경을 생성하는 것을 보여줬는데, 이 방법을 따라해봤습니다. 큰 문제 없이 가상 환경이 만들어졌고 다음 단계로 이어갔습니다. conda를 이용한 가상 환경 관련 명령어는 다음과 같습니다. .. 2024. 5. 3.
[Streamlit] 개발 환경 설정 1. config.toml 파일 정의 및 생성2. config.toml 파일 설정오늘은 Streamlit 개발 환경을 설정하는 방법 중 하나인 config.toml 파일에 대해 알아보도록 하겠습니다.1. config.toml 정의 config.toml 파일은 Streamlit 애플리케이션을 설정하기 위한 파일입니다. 이 파일을 통해 애플리케이션의 외관, 동작 및 기타 설정을 조정할 수 있습니다. 파일의 생성 위치는 .streamlit/config.toml  입니다. 이 파일은 특정한 위치에 있어야만 Streamlit이 그 내용을 인식하므로, 생성 위치에 주의해야 합니다. 프로젝트를 처음 만들게되면 .streamlit 이 없기때문에 이전에 디렉터리를 생성하지 않은 경우 추가해줘야합니다.  2. confi.. 2024. 4. 29.
[Algorithm] 다익스트라 알고리즘(Dijkstra’s Algorithm) 1. 백준 1916번 문제 2. 다익스트라 알고리즘(Dijkstra’s Algorithm) 1. 백준 1916번 문제 오늘도 알고리즘 공부를 위해 백준 문제에 도전했는데, 1916번 문제인 "최소비용 구하기"에 도전했습니다. 처음에는 간단하게 DFS를 이용하려 했지만, 최대 도시의 수가 100,000개로 주어지고 시간 제한이 0.5초라는 점을 고려하니 다른 접근 방식이 필요하다고 느꼈습니다. 문제에서 어떤 간선에는 큰 값이 들어갈 수도 있고 작은 값이 들어갈 수도 있다는 점을 고려하면, 결국에는 모든 경우를 탐색해야 한다고 생각했습니다. 그러나 시간 제한이 짧기 때문에 조건을 걸어주어 조기에 탐색을 종료할 수 있도록 백트래킹을 이용하여 코드를 작성했습니다. import sys sys.setrecursio.. 2024. 4. 11.
Text Embedding 1. Text Embedding 이란2. 임베딩 방법3. Word2vec 1. Text Embedding 이란기존의 비정형 데이터 형태의 자연어 데이터를 n차원의 수치형 벡터로 표상화 시킨 데이터단순히 텍스트를 숫자로 변환하는 것이 아니라 해당 언어가 가지는 의미적 컨텍스트를 지닌 숫자로 변환머신러닝 알고리즘 활용 시 분석에 용이한 형태 2. 임베딩 방법1) Sparse Vector(구문 정보 중심)문장 내에 단어의 등장 여부, 등장 빈도 등 구문론적 정보가 표현(의미가 다르더라도 동일한 단어 구성이라면 벡터의 생김새가 동일 )대부분의 요소가 0으로 채워지고, 소수의 요소만이 0이 아닌 값을 갖는 벡터일반적으로 희소 벡터는 실제 데이터에 비해 매우 큰 차원을 가지는 경우에 사용비효율적인 저장공간단어의 의.. 2024. 4. 11.