[Azure] Azure AI Document Intelligence 소개
카테고리: Azure
태그: azure ai document intelligence azure portal azure services azure
🎯 Azure AI Document Intelligence 소개
Azure AI Document Intelligence에 대해 알아보자.
- Azure는 많은 기능이 빠르게 변화하고 있으므로 캡처한 이미지는 참고만 하자.
1. Azure AI
Azure에서는 다양한 인공지능 관련 기술을 사용할 수 있도록 여러가지 포트폴리오를 제공하고 있다.
1.1 제품 설명
제품/서비스 | 설명 |
---|---|
Azure AI Studio | 모델 평가 및 생성 AI 솔루션 배포를 위한 통합 AI 개발 플랫폼을 빠르게 시작할 수 있습니다. GitHub 통합 및 내장된 콘텐츠 안전 기능으로 프로덕션까지의 과정이 매끄럽게 진행됩니다. |
Azure AI Services | 바로 사용할 수 있는 엔터프라이즈급 API를 통해 생성 AI 및 멀티모달의 위력을 활용할 수 있습니다. 여기에는 Azure OpenAI 서비스와 검색 증강 생성(RAG)을 위한 Azure AI 검색이 포함됩니다. |
Azure Machine Learning | 데이터 준비, 모델 개발, 훈련을 위한 전체 라이프사이클 관리와 함께 PyTorch 및 TensorFlow에 대한 엔터프라이즈 지원을 통해 머신 러닝 프로젝트를 더 빠르게 진행할 수 있습니다. |
Azure Global Infrastructure | OpenAI, Nvidia, 그리고 포춘 500에 포함된 AI 리더들이 신뢰하는 안전하고 확장 가능한 인프라를 갖춘 종합적인 AI 플랫폼에서 솔루션을 개발할 수 있습니다. |
1.1.1 Azure AI Studio
- 생성 AI 앱을 개발, 배포, 관리하는 통합 플랫폼으로 preview 기간을 거쳐 Microsoft Build 2024에 GA(generally available)가 되었다.
1.1.2 Azure AI Services
- Azure AI 서비스는 개발자가 즉시 사용 가능한 맞춤형 API와 모델을 통해 지능적이고 최첨단의 시장 준비가 완료된 책임 있는 애플리케이션을 신속하게 만들 수 있도록 도와준다.
- 대부분의 Azure AI 서비스는 인기 있는 개발 언어의
REST API
및클라이언트 라이브러리 SDK
를 통해 사용할 수 있다. - 더 자세한 서비스 세부 항목은 아래 표와 What are Azure AI services? 참고
서비스 | 설명 |
---|---|
Azure AI Search | 모바일과 웹앱에 AI 기반 클라우드 검색 기능을 제공합니다. |
Azure OpenAI | 다양한 자언어 작업을 수행합니다. |
Bot Service | 봇을 만들어 여러 채널에 연결합니다. |
Content Safety | 원치 않는 콘텐츠를 탐지하는 AI 서비스입니다. |
Custom Vision | 비즈니스에 맞게 이미지 인식을 커스터마이즈합니다. |
Document Intelligence | 문서를 지능형 데이터 기반 솔루션으로 전환합니다. |
Face | 이미지에서 사람과 감정을 감지하고 식별합니다. |
Immersive Reader | 사용자가 텍스트를 읽고 이해할 수 있도록 지원합니다. |
Language | 업계 최고의 자연어 이해 기능을 사용하여 앱을 빌드합니다. |
Speech | 음성-텍스트 변환, 텍스트-음성 변환, 번역 및 화자 인식을 수행합니다. |
Translator | AI 기반 번역 기술을 사용하여 100개 이상의 언어로 번역합니다. |
Video Indexer | 비디오에서 실행 가능한 인사이트를 추출합니다. |
Vision | 이미지와 비디오 콘텐츠를 분석합니다. |
2. Azure AI Document Intelligence
Azure AI Document Intelligence는 지능형 문서 처리 솔루션을 구축할 수 있도록 해주는 클라우드 기반 Azure AI 서비스이다.
2.1 문서 분석 모델(Document Analysis Models)
문서 분석 모델을 사용하면 양식 및 문서에서 텍스트를 추출하고 조직의 작업, 사용 또는 개발을 위해 준비된 구조화된 비즈니스 준비 콘텐츠를 반환할 수 있다.
기능 | 설명 | 언어 지원 |
---|---|---|
Read | 인쇄된 텍스트 및 필기 텍스트를 추출합니다. | 한글 지원 |
Layout | 텍스트, 표 그리고 문서 구조를 추출합니다. | 한글 지원 |
General documents | 텍스트, 구조, 키-값 쌍을 추출합니다. | 한글 지원 |
2.2 사전 제작된 모델(Prebuilt models)
사전 제작된 모델을 사용하면 자체 모델을 학습하고 구축하지 않고도 지능형 문서 처리를 앱과 플로우에 추가할 수 있다.
문서 유형 | 설명 | 언어 지원 |
---|---|---|
Invoices | 고객 및 공급업체 세부 정보를 추출합니다. | 한글 지원 |
Receipts | 판매 거래 세부 정보를 추출합니다. | 한글 지원 |
Identity documents | 검증 세부 정보를 추출합니다. | 일부 한글 지원 |
Business cards | 비즈니스 연락처 세부 정보를 추출합니다. | 한글 지원 |
Credit/Debit cards | 결제 카드 정보를 추출합니다. | 명시적인 한글 지원 없음 |
2.3 맞춤형 모델(Custom models)
맞춤형 모델은 레이블이 지정된 데이터 세트를 사용하여 특정 사용 사례에 맞춘 양식과 문서에서 고유한 데이터를 추출하도록 학습된다. 독립적인 맞춤형 모델은 결합하여 조합 모델을 만들 수 있다.
2.3.1 추출 모델(Extraction models)
문서에서 레이블이 지정된 필드를 추출하도록 학습된다.
기능 | 설명 | 언어 지원 |
---|---|---|
Custom template | 정적 레이아웃에서 데이터를 추출합니다. | - |
Custom neural | 혼합 형식 문서에서 데이터를 추출합니다. | - |
Custom composed | 모델 컬렉션을 사용하여 데이터를 추출합니다. | - |
2.3.2 분류 모델(Classifier modes)
추출 모델을 호출하기 전에 문서 형식을 식별한다.
기능 | 설명 | 언어 지원 |
---|---|---|
Custom classifier | 추출 모델을 호출하기 전에 지정된 문서 유형(클래스)을 식별합니다. | - |