[Week 4 ] Flowise Document Loaders

[email protected]  |  2025-09-24 17:59


https://docs.flowiseai.com/integrations/langchain/document-loaders

1. 파일 기반 (File-based)

  1. File Loader – 로컬/업로드된 파일을 불러오는 기본 로더
  2. PDF Files – PDF 문서를 텍스트로 변환
  3. Docx / Microsoft Word / Excel / PowerPoint – MS Office 문서 불러오기
  4. Csv File – CSV 형식 데이터 로드
  5. Json / Json Lines File – JSON 형식의 데이터 읽기
  6. Text / Plain Text / Epub File – 단순 텍스트, 전자책(ePub) 파일 불러오기

2. 클라우드 / 외부 저장소

  1. Google Drive – 구글 드라이브에 저장된 문서 가져오기
  2. S3 File Loader – AWS S3 버킷에 저장된 파일 불러오기

3. 폴더 / 일괄 처리

  1. Folder Loader – 특정 폴더 안의 모든 파일을 한 번에 불러오기
  2. Unstructured Folder Loader – 비정형 문서 폴더를 구조 분석 후 불러오기

4. 웹 / 스크래핑

  1. Cheerio Web Scraper – 정적 웹페이지의 HTML을 파싱
  2. Playwright / Puppeteer Web Scraper – 동적 웹페이지(자바스크립트 렌더링 포함) 크롤링
  3. Apify Website Content Crawler – Apify 플랫폼을 통한 웹사이트 크롤링
  4. FireCrawl – 빠른 웹 크롤링 API
  5. Spider – 검색 및 웹 크롤링 통합 툴

5. 검색 API 연동

  1. SerpApi for Web Search – 구글 검색 API 결과 불러오기
  2. SearchApi for Web Search – 여러 검색엔진 API 결과 가져오기
  3. BraveSearch Loader – 브레이브(Brave) 검색 엔진 연동

6. SaaS / 협업 툴

  1. Notion – 노션에 작성된 페이지/DB 불러오기
  2. Confluence – Confluence 위키 문서 가져오기
  3. Jira – Jira 이슈/프로젝트 데이터 가져오기
  4. GitHub – GitHub 리포지토리 문서 및 코드 읽기
  5. GitBook – GitBook 문서 불러오기
  6. Google Sheets – 구글 스프레드시트 데이터를 로드
  7. Airtable – Airtable(온라인 DB/스프레드시트 툴)에서 데이터 가져오기
  8. Figma – Figma 디자인 문서/데이터 불러오기
  9. Oxylabs – 프록시/데이터 수집 서비스 연동

7. 고급 / 커스텀

  1. Unstructured File Loader – 비정형 문서에서 표/제목/목록 등 구조화된 데이터 추출
  2. Unstructured Folder Loader – 폴더 단위로 비정형 문서를 처리
  3. Custom Document Loader – 직접 정의한 방식으로 문서 불러오기
  4. Document Store Loader – 이미 Flowise Document Store에 저장된 문서를 로드