[Azure] Azure AI Document Intelligence 소개

Date:     Updated:

카테고리:

태그:

🎯 Azure AI Document Intelligence 소개

Azure AI Document Intelligence에 대해 알아보자.

  • Azure는 많은 기능이 빠르게 변화하고 있으므로 캡처한 이미지는 참고만 하자.

1. Azure AI

Azure에서는 다양한 인공지능 관련 기술을 사용할 수 있도록 여러가지 포트폴리오를 제공하고 있다.

1.1 제품 설명

제품/서비스 설명
Azure AI Studio 모델 평가 및 생성 AI 솔루션 배포를 위한 통합 AI 개발 플랫폼을 빠르게 시작할 수 있습니다. GitHub 통합 및 내장된 콘텐츠 안전 기능으로 프로덕션까지의 과정이 매끄럽게 진행됩니다.
Azure AI Services 바로 사용할 수 있는 엔터프라이즈급 API를 통해 생성 AI 및 멀티모달의 위력을 활용할 수 있습니다. 여기에는 Azure OpenAI 서비스와 검색 증강 생성(RAG)을 위한 Azure AI 검색이 포함됩니다.
Azure Machine Learning 데이터 준비, 모델 개발, 훈련을 위한 전체 라이프사이클 관리와 함께 PyTorch 및 TensorFlow에 대한 엔터프라이즈 지원을 통해 머신 러닝 프로젝트를 더 빠르게 진행할 수 있습니다.
Azure Global Infrastructure OpenAI, Nvidia, 그리고 포춘 500에 포함된 AI 리더들이 신뢰하는 안전하고 확장 가능한 인프라를 갖춘 종합적인 AI 플랫폼에서 솔루션을 개발할 수 있습니다.

1.1.1 Azure AI Studio

  • 생성 AI 앱을 개발, 배포, 관리하는 통합 플랫폼으로 preview 기간을 거쳐 Microsoft Build 2024에 GA(generally available)가 되었다.

1.1.2 Azure AI Services

  • Azure AI 서비스는 개발자가 즉시 사용 가능한 맞춤형 API와 모델을 통해 지능적이고 최첨단의 시장 준비가 완료된 책임 있는 애플리케이션을 신속하게 만들 수 있도록 도와준다.
  • 대부분의 Azure AI 서비스는 인기 있는 개발 언어의 REST API클라이언트 라이브러리 SDK를 통해 사용할 수 있다.
  • 더 자세한 서비스 세부 항목은 아래 표와 What are Azure AI services? 참고
서비스 설명
Azure AI Search 모바일과 웹앱에 AI 기반 클라우드 검색 기능을 제공합니다.
Azure OpenAI 다양한 자언어 작업을 수행합니다.
Bot Service 봇을 만들어 여러 채널에 연결합니다.
Content Safety 원치 않는 콘텐츠를 탐지하는 AI 서비스입니다.
Custom Vision 비즈니스에 맞게 이미지 인식을 커스터마이즈합니다.
Document Intelligence 문서를 지능형 데이터 기반 솔루션으로 전환합니다.
Face 이미지에서 사람과 감정을 감지하고 식별합니다.
Immersive Reader 사용자가 텍스트를 읽고 이해할 수 있도록 지원합니다.
Language 업계 최고의 자연어 이해 기능을 사용하여 앱을 빌드합니다.
Speech 음성-텍스트 변환, 텍스트-음성 변환, 번역 및 화자 인식을 수행합니다.
Translator AI 기반 번역 기술을 사용하여 100개 이상의 언어로 번역합니다.
Video Indexer 비디오에서 실행 가능한 인사이트를 추출합니다.
Vision 이미지와 비디오 콘텐츠를 분석합니다.

2. Azure AI Document Intelligence

Azure AI Document Intelligence는 지능형 문서 처리 솔루션을 구축할 수 있도록 해주는 클라우드 기반 Azure AI 서비스이다.

2.1 문서 분석 모델(Document Analysis Models)

문서 분석 모델을 사용하면 양식 및 문서에서 텍스트를 추출하고 조직의 작업, 사용 또는 개발을 위해 준비된 구조화된 비즈니스 준비 콘텐츠를 반환할 수 있다.

기능 설명 언어 지원
Read 인쇄된 텍스트 및 필기 텍스트를 추출합니다. 한글 지원
Layout 텍스트, 표 그리고 문서 구조를 추출합니다. 한글 지원
General documents 텍스트, 구조, 키-값 쌍을 추출합니다. 한글 지원

2.2 사전 제작된 모델(Prebuilt models)

사전 제작된 모델을 사용하면 자체 모델을 학습하고 구축하지 않고도 지능형 문서 처리를 앱과 플로우에 추가할 수 있다.

문서 유형 설명 언어 지원
Invoices 고객 및 공급업체 세부 정보를 추출합니다. 한글 지원
Receipts 판매 거래 세부 정보를 추출합니다. 한글 지원
Identity documents 검증 세부 정보를 추출합니다. 일부 한글 지원
Business cards 비즈니스 연락처 세부 정보를 추출합니다. 한글 지원
Credit/Debit cards 결제 카드 정보를 추출합니다. 명시적인 한글 지원 없음

2.3 맞춤형 모델(Custom models)

맞춤형 모델은 레이블이 지정된 데이터 세트를 사용하여 특정 사용 사례에 맞춘 양식과 문서에서 고유한 데이터를 추출하도록 학습된다. 독립적인 맞춤형 모델은 결합하여 조합 모델을 만들 수 있다.

2.3.1 추출 모델(Extraction models)

문서에서 레이블이 지정된 필드를 추출하도록 학습된다.

기능 설명 언어 지원
Custom template 정적 레이아웃에서 데이터를 추출합니다. -
Custom neural 혼합 형식 문서에서 데이터를 추출합니다. -
Custom composed 모델 컬렉션을 사용하여 데이터를 추출합니다. -

2.3.2 분류 모델(Classifier modes)

추출 모델을 호출하기 전에 문서 형식을 식별한다.

기능 설명 언어 지원
Custom classifier 추출 모델을 호출하기 전에 지정된 문서 유형(클래스)을 식별합니다. -

Azure 카테고리 내 다른 글 보러가기