반려인에게 PDF 안에 있는 그림을 자동 추출해서 저장할 수 없냐는 의뢰를 받았다. 대가는 칭찬이다. 가보쟈고✅ Summary📍코드 짜기 전 이것저것태블릿PC로 문서 위에 그림을 바로 그린 다음 이걸 PDF 문서로 저장해서 주기 때문에 Ctrl+C, V 버튼이 안먹혔다.Acrobat Pro에서는 그림을 자동으로 인식해서 자를 수 있게 해주긴 하던데, 그럼 딱 그 PDF 내 그림 그대로를 자르기 때문에 확대하면 화질도 깨지고 폴더에 촤르르르 자동저장하는 기능도 못 쓰는 문제가 있었다.코드 아예 모르는 사람도 사용할 수 있게 파일업로드 후 버튼 몇 번만 누르면 이미지 자동 캡쳐 후 폴더에 자동 저장될 수 있도록 기능을 구현해야겠다 생각했다. 그래서 Colab을 이용했다. 구글은 다들 많이 쓰니까📍구현 ..
✅ 함수 및 패키지📍 변수 및 함수🧮 여러 변수 만들기## 숫자 5개로 구성된 var1 생성var1 🧮 함수 간단 맛보기## paste() : 여러 문자를 합쳐 하나로 만드는 함수x 📍 패키지함수를 이용하려면 함수가 들어있는 패키지를 설치하고 불러들여야 합니다. 패키지는 한 번만 설치하면 되지만, 패키지를 로드하는 작업은 R 스튜디오를 새로 시작할 때마다 반복해야합니다.그래프를 작업할 때 가장 많이 사용하는 패키지인 gglot2 패키지에는 ggplot(), qplot(), geom_histogram() 등 수십가지 관련 함수가 들어있습니다.# ggplot2 패키지 설치install.packages("ggplot2")# ggplot2 패키지 로드library(ggplot2)x 다른 예시도 알아보겠..
최근 Google은 새로운 신경망 아키텍처인 Titans를 발표했습니다. 기존 Transformer 모델의 한계를 넘어, 인간과 유사한 기억력을 갖추도록 설계된 혁신적인 접근 방식을 제안하며, 긴 문맥 데이터를 효과적으로 처리할 수 있는 새로운 방법을 제공합니다. 특히, Titans는 장기 기억(long-term memory)과 단기 기억(short-term memory)을 효과적으로 통합하여 대규모 데이터 처리와 정보 활용에서 기존 모델보다 뛰어난 성능을 보여줍니다.이에 관한 더 자세한 내용은 구글에서 발표한 논문 "Titans: Learning to Memorize at Test Time"을 참고하면 좋을 것 같습니다. ✅ Transformer에서 Titans로 Transformer는 현대 인공지능의..
✅ R 개요📍R이란?R은 데이터를 분석하는데 사용되는 소프트웨어로, 어떤 형태 데이터든 자유롭게 분석할 수 있습니다. 통계분석, 머신러닝 모델링, 텍스트 마이닝, 시각화, 이미지 분석, 웹 애플리케이션 분석 등 다양한 작업을 수행할 수 있습니다.R은 SAS, SPSS와 달리 새로운 분석 기법이나 패키지가 등장하면 CRAN(cran.r-project.org)에서 확인할 수 있습니다. CRAN은 만 개가 넘는 패키지가 공개되어 있다고 합니다.https://cran.r-project.org/ The Comprehensive R Archive Network cran.r-project.org 📍R STUDIO란?R 스튜디오는 R을 사용하기 편리하게 만들어주는 IDE(통합 개발 환경) 소프트웨어입니다. R을 먼..
✅ 역전파(Backpropagation) 알고리즘이란?신경망의 가중치를 학습시키기 위한 방법으로, 출력에서부터 입력 방향으로 오차를 전파하여 각 층의 가중치를 업데이트합니다. 이를 통해 모델의 예측 오류를 최소화합니다. 주로 경사 하강법(Gradient Descent)과 함께 사용됩니다. ✅ 딥러닝에서 사용되는 활성화 함수의 종류와 특징시그모이드 함수 (Sigmoid Function)특징: 출력 값을 0과 1 사이로 압축합니다.장점: 출력 값이 확률로 해석될 수 있어 이진 분류 문제에 유용합니다.단점: 경사가 작아질 수 있는 Vanishing Gradient 문제가 발생할 수 있습니다.하이퍼볼릭 탄젠트 (tanh) 함수특징: 출력 값을 -1과 1 사이로 압축합니다.장점: 시그모이드 함수보다 중심이 0에 ..
✅ 딥러닝이란?딥러닝은 인공 신경망(Artificial Neural Networks, ANN)을 기반으로 한 머신러닝의 한 분야입니다. 딥러닝 모델은 여러 층의 뉴런으로 구성되어 있으며, 이를 통해 복잡한 데이터에서 패턴을 학습하고 추출할 수 있습니다. 대표적인 딥러닝 모델로는 컨볼루션 신경망(CNN), 순환 신경망(RNN), 변환자(Transformer)등이 있습니다. ✅ 딥러닝과 머신러닝의 차이점은?머신러닝은 데이터로부터 패턴을 학습하여 예측을 수행하는 알고리즘의 집합입니다. 머신러닝 알고리즘에는 지도학습, 비지도학습, 강화학습 등이 있으며, 예를 들어 선형 회귀, 결정 트리, K-평균 클러스터링 등이 있습니다.딥러닝은 머신러닝의 한 분야로, 인공신경망(특히 다층 신경망)을 사용하여 복잡한 데이터의 ..
이번 MLOps 프로젝트에 MLflow를 사용하여 모델 관리 등등을 진행하기로 했다.error, 막혔던 부분 등을 잊어버리지 않고 다음에 mlflow 사용할 일이 있다면 이때 시행착오를 줄이기 위해 작성하는 글로...우당탕탕 시행착오기 시작합니다. ✅ MLFlow란? 머신러닝의 생애주기를 위한 오픈 소스 플랫폼이다. MLflow의 전체 흐름을 잘 나타내는 그림이다. 근데 난 이 그림이 더 이해하기 쉬웠다..ㅎㅎ주요 구성요소1) MLflow Tracking: 실험 기록을 추적하며, 파라미터와 그 결과를 비교 및 기록한다. - 예를 들어, 여러 사람이 하나의 MLflow 서버위에서 각자 자기 실험을 만들고 공유할 수 있다. - 각 실행에 사용한 소스 코드, 하이퍼 파라미터, Metric, 부산물(모델..
딥러닝 프레임워크는 복잡한 신경망 모델을 설계, 훈련, 검증, 배포를 위해 사용되는 라이브러리와 도구이다. 이들을 사용하면 딥러닝 알고리즘 구현을 쉽게 할 수 있을 뿐만 아니라, 높은 수준에서 모델 구축 및 실험이 가능하다. 프로젝트 특성이나 목적, 환경 등에 따라 적절한 프레임워크를 사용하는 것이 중요하다. 아래는 프로젝트 특성에 따른 딥러닝 프레임워크 선택 예시이다.연구 목적: 실험적인 아키텍처와 알고리즘에 적합한 유연성을 제공하는 PyTorch 추천산업 등 대규모 데이터 사용: 대규모 데이터 세트와 복잡한 모델을 다루는 데 필요한 도구와 확장성을 제공하는 TensorFlow 추천교육 및 프로토타이핑: 간단하고 직관적인 API로 신속한 모델 구축을 지원하여 학습과 프로토타이핑에 이상적인 Keras 추..