AI & DATA

반려인에게 PDF 안에 있는 그림을 자동 추출해서 저장할 수 없냐는 의뢰를 받았다. 대가는 칭찬이다. 가보쟈고✅ Summary📍코드 짜기 전 이것저것태블릿PC로 문서 위에 그림을 바로 그린 다음 이걸 PDF 문서로 저장해서 주기 때문에 Ctrl+C, V 버튼이 안먹혔다.Acrobat Pro에서는 그림을 자동으로 인식해서 자를 수 있게 해주긴 하던데, 그럼 딱 그 PDF 내 그림 그대로를 자르기 때문에 확대하면 화질도 깨지고 폴더에 촤르르르 자동저장하는 기능도 못 쓰는 문제가 있었다.코드 아예 모르는 사람도 사용할 수 있게  파일업로드 후 버튼 몇 번만 누르면 이미지 자동 캡쳐 후 폴더에 자동 저장될 수 있도록 기능을 구현해야겠다 생각했다. 그래서 Colab을 이용했다. 구글은 다들 많이 쓰니까📍구현 ..
· AI & DATA/R
✅ 함수 및 패키지📍 변수 및 함수🧮 여러 변수 만들기## 숫자 5개로 구성된 var1 생성var1  🧮 함수 간단 맛보기## paste() : 여러 문자를 합쳐 하나로 만드는 함수x 📍 패키지함수를 이용하려면 함수가 들어있는 패키지를 설치하고 불러들여야 합니다. 패키지는 한 번만 설치하면 되지만, 패키지를 로드하는 작업은 R 스튜디오를 새로 시작할 때마다 반복해야합니다.그래프를 작업할 때 가장 많이 사용하는 패키지인 gglot2 패키지에는 ggplot(), qplot(), geom_histogram() 등 수십가지 관련 함수가 들어있습니다.# ggplot2 패키지 설치install.packages("ggplot2")# ggplot2 패키지 로드library(ggplot2)x 다른 예시도 알아보겠..
· AI & DATA/AI
최근 Google은 새로운 신경망 아키텍처인 Titans를 발표했습니다. 기존 Transformer 모델의 한계를 넘어, 인간과 유사한 기억력을 갖추도록 설계된 혁신적인 접근 방식을 제안하며, 긴 문맥 데이터를 효과적으로 처리할 수 있는 새로운 방법을 제공합니다. 특히, Titans는 장기 기억(long-term memory)과 단기 기억(short-term memory)을 효과적으로 통합하여 대규모 데이터 처리와 정보 활용에서 기존 모델보다 뛰어난 성능을 보여줍니다.이에 관한 더 자세한 내용은 구글에서 발표한 논문 "Titans: Learning to Memorize at Test Time"을 참고하면 좋을 것 같습니다. ✅ Transformer에서 Titans로 Transformer는 현대 인공지능의..
· AI & DATA/R
✅ R 개요📍R이란?R은 데이터를 분석하는데 사용되는 소프트웨어로, 어떤 형태 데이터든 자유롭게 분석할 수 있습니다. 통계분석, 머신러닝 모델링, 텍스트 마이닝, 시각화, 이미지 분석, 웹 애플리케이션 분석 등 다양한 작업을 수행할 수 있습니다.R은 SAS, SPSS와 달리 새로운 분석 기법이나 패키지가 등장하면 CRAN(cran.r-project.org)에서 확인할 수 있습니다. CRAN은 만 개가 넘는 패키지가 공개되어 있다고 합니다.https://cran.r-project.org/ The Comprehensive R Archive Network cran.r-project.org 📍R STUDIO란?R 스튜디오는 R을 사용하기 편리하게 만들어주는 IDE(통합 개발 환경) 소프트웨어입니다. R을 먼..
· AI & DATA/AI
✅ 역전파(Backpropagation) 알고리즘이란?신경망의 가중치를 학습시키기 위한 방법으로, 출력에서부터 입력 방향으로 오차를 전파하여 각 층의 가중치를 업데이트합니다. 이를 통해 모델의 예측 오류를 최소화합니다. 주로 경사 하강법(Gradient Descent)과 함께 사용됩니다. ✅ 딥러닝에서 사용되는 활성화 함수의 종류와 특징시그모이드 함수 (Sigmoid Function)특징: 출력 값을 0과 1 사이로 압축합니다.장점: 출력 값이 확률로 해석될 수 있어 이진 분류 문제에 유용합니다.단점: 경사가 작아질 수 있는 Vanishing Gradient 문제가 발생할 수 있습니다.하이퍼볼릭 탄젠트 (tanh) 함수특징: 출력 값을 -1과 1 사이로 압축합니다.장점: 시그모이드 함수보다 중심이 0에 ..
· AI & DATA/AI
✅ 딥러닝이란?딥러닝은 인공 신경망(Artificial Neural Networks, ANN)을 기반으로 한 머신러닝의 한 분야입니다. 딥러닝 모델은 여러 층의 뉴런으로 구성되어 있으며, 이를 통해 복잡한 데이터에서 패턴을 학습하고 추출할 수 있습니다. 대표적인 딥러닝 모델로는 컨볼루션 신경망(CNN), 순환 신경망(RNN), 변환자(Transformer)등이 있습니다. ✅ 딥러닝과 머신러닝의 차이점은?머신러닝은 데이터로부터 패턴을 학습하여 예측을 수행하는 알고리즘의 집합입니다. 머신러닝 알고리즘에는 지도학습, 비지도학습, 강화학습 등이 있으며, 예를 들어 선형 회귀, 결정 트리, K-평균 클러스터링 등이 있습니다.딥러닝은 머신러닝의 한 분야로, 인공신경망(특히 다층 신경망)을 사용하여 복잡한 데이터의 ..
· AI & DATA/AI
이번 MLOps 프로젝트에 MLflow를 사용하여 모델 관리 등등을 진행하기로 했다.error, 막혔던 부분 등을 잊어버리지 않고 다음에 mlflow 사용할 일이 있다면 이때 시행착오를 줄이기 위해 작성하는 글로...우당탕탕 시행착오기 시작합니다.  ✅ MLFlow란? 머신러닝의 생애주기를 위한 오픈 소스 플랫폼이다. MLflow의 전체 흐름을 잘 나타내는 그림이다. 근데 난 이 그림이 더 이해하기 쉬웠다..ㅎㅎ​주요 구성요소1) MLflow Tracking: 실험 기록을 추적하며, 파라미터와 그 결과를 비교 및 기록한다. - 예를 들어, 여러 사람이 하나의 MLflow 서버위에서 각자 자기 실험을 만들고 공유할 수 있다. - 각 실행에 사용한 소스 코드, 하이퍼 파라미터, Metric, 부산물(모델..
· AI & DATA/AI
딥러닝 프레임워크는 복잡한 신경망 모델을 설계, 훈련, 검증, 배포를 위해 사용되는 라이브러리와 도구이다. 이들을 사용하면 딥러닝 알고리즘 구현을 쉽게 할 수 있을 뿐만 아니라, 높은 수준에서 모델 구축 및 실험이 가능하다. 프로젝트 특성이나 목적, 환경 등에 따라 적절한 프레임워크를 사용하는 것이 중요하다. 아래는 프로젝트 특성에 따른 딥러닝 프레임워크 선택 예시이다.연구 목적: 실험적인 아키텍처와 알고리즘에 적합한 유연성을 제공하는 PyTorch 추천산업 등 대규모 데이터 사용: 대규모 데이터 세트와 복잡한 모델을 다루는 데 필요한 도구와 확장성을 제공하는 TensorFlow 추천교육 및 프로토타이핑: 간단하고 직관적인 API로 신속한 모델 구축을 지원하여 학습과 프로토타이핑에 이상적인 Keras 추..