Hanyang Univ.
25년 2학기
[Week 13] Random Forest 예제 코드
[Week 11] Random Forest
(Random Forest Training and Interpretation)랜덤 포레스트는 비선형 머신러닝 모델 중에서도 안정성과 해석력의 균형이 좋은 알고리즘으로, 데이터가 많지 않은 상황에서도 높은 예측 성능을 보입니다.1️⃣ 개념 요약여러 개의 결정 트리(Decision Trees) 를 …
[Week 11] 데이터 분석 전체 프로세스
(End-to-End Machine Learning Workflow)머신러닝 프로젝트는 단순히 모델을 만드는 일이 아니라, 데이터를 문제 해결에 맞게 가공하고 검증하는 전체 프로세스의 관리가 핵심입니다.1️⃣ 문제 정의 (Problem Definition)예측 대상(y) 과 입력 변수(X) 를 명확히 …
[Week 10] Streamlit
1. 텍스트 기능 (Text Elements)함수설명st.write()텍스트, 데이터, 차트 등 만능 출력st.markdown()마크다운 + HTML 지원st.title(), st.header()제목 계층 구조공식 문서 섹션: Text elements2. 테이블 기능 (Data Display)함수설명st.dataframe()인터랙티브 테이블 (정렬·필터)st.table()정적 테이블 (고정 레이아웃)st.metric()KPI 요약 …
[Week 8] AI OCR 기술 개요
OCR 기술 흐름전통 OCR: Tesseract(Google, 2006~)은 LSTM 기반으로 100+ 언어 지원, CPU 실행(수 MB 메모리). 문자 인식에 특화, CER 10-20%(인쇄물), 30-50%(손글씨). 복잡한 레이아웃(표, 다단) 처리 약함.멀티모달 LLM: 2020년대부터 GPT-4V(ChatGPT), Gemini …
[Week 7] Condition Agent Node
기능이 노드는 대화형 AI(LLM)를 사용해 워크플로우를 유연하게 분기시킵니다. 사용자가 미리 정한 "시나리오"(가능한 상황이나 분류)를 기반으로, 자연어로 작성된 "지침"에 따라 입력된 내용을 분석해 어떤 경로로 갈지 결정합니다. AI가 이 분석 결과에 …
[Week 7] Tokenizer
1. 텍스트 → 토큰 (Tokenizer 단계)**토크나이저(tokenizer)**는 “문장을 모델이 이해할 수 있는 단위(토큰)”로 쪼개는 역할을 합니다.예를 들어:"로봇이 움직인다."→ ["로", "봇", "이", " ", "움", "직", "인", "다", "."]이 각각이 **토큰(token)**입니다.영어의 경우 …
[Week 5] PDF Loader
1. PDF Loader 개요역할: PDF 파일을 Flowise에 불러와 Document 객체로 변환.활용 단계: Loader → Text Splitter → Embedding → Vector Store 업서트2. 처리 모드 (Processing Modes)모드설명장점단점활용 추천Per Page각 PDF 페이지를 …
[Week 4] RAG
1. RAG란?RAG(Retrieval-Augmented Generation)는 **검색(Retrieval)**과 **생성(Generation)**을 결합한 AI 기술로, LLM(Large Language Model)의 Hallucination(부정확하거나 가상의 답변 생성)을 줄이고 정확한 답변을 제공합니다.검색 단계: 질문과 관련된 외부 데이터(문서, DB 등)를 검색.생성 단계: 검색된 데이터를 …
[Week 4 ] Flowise Document Loaders
https://docs.flowiseai.com/integrations/langchain/document-loaders1. 파일 기반 (File-based)File Loader – 로컬/업로드된 파일을 불러오는 기본 로더PDF Files – PDF 문서를 텍스트로 변환Docx / Microsoft Word / Excel / PowerPoint – MS Office 문서 불러오기Csv File …
[Week 3] Flowise LLM 노드
https://docs.flowiseai.com/using-flowise/agentflowv2#id-2.-llm-node1. 모델 설정 (Model Selection)Model설명: 사용할 언어 모델 선택. Flowise UI에서 ChatOpenAI 선택 시 OpenAI 모델 사용.옵션:gpt-4o-mini: 비용 효율적, 텍스트+이미지 처리 가능. 맥락 창 128K 토큰.gpt-5-nano: 초경량, 텍스트 중심(이미지 미지원). …
[Week 3] Agentflow Node
https://docs.flowiseai.com/using-flowise/agentflowv2#agentflow-v2-node-reference1. 시작 노드 (Start Node)기능: 워크플로우 실행의 진입점. 모든 워크플로우는 이 노드에서 시작.역할: 워크플로우 트리거 방식과 초기 조건을 정의. 사용자 입력(채팅 또는 폼) 수신, Flow State 변수 초기화, 대화 메모리 …
[Week 2] 주요 AI 알고리즘
ML 기반 알고리즘적용 데이터: 구조화된 데이터 (숫자/범주형, 예: 엑셀, CRM), 시계열 데이터 (시간 순서, 예: 센서, 주식), 다중 데이터 (복합 형태)트리 기반의사결정나무: 단순, 해석 쉬움. 소규모 데이터 적합예: 소매점 재고 …
[Week 1] 2. 가까운 미래
AI의 업무 및 일상 적용 확대특징: AI가 업무와 일상에서 광범위하게 적용되며, 자동화된 작업 수행이 표준화. 디지털 환경에서 대부분의 업무(예: 데이터 분석, 고객 응대, 콘텐츠 생성)가 AI로 처리 가능.기술적 전망:LLM API …
[Week 1] 1. 생성형 AI 발전 동향
주요 사건 및 서비스 출시2022LangChain (2022.10): LLM 애플리케이션 개발을 위한 오픈소스 프레임워크.기술적 특징: LLM 체인, 에이전트, 메모리 등 모듈 제공으로 복잡한 AI 워크플로우 구축 가능.Perplexity AI (2022.8): AI 기반 검색 …