HomeAboutMeBlogGuest
© 2025 Sejin Cha. All rights reserved.
Built with Next.js, deployed on Vercel
🛁
공부기록
/
🍀
Spring
/
🚲
Apach Tiak란?
🚲

Apach Tiak란?

 
아파치 티카란?REF
 

아파치 티카란?

아파치 티카는 PPT, CSV, PDF등 다양한 형태의, 파일의 메타 데이터와 텍스트를 감지하고 추출하는 라이브러리 입니다.
 
지원되는 포멧은 아래와 같습니다.
notion image
  • tika-core : 핵심 라이브러리(파서 없음)
  • tika-parsers - core + Tika Parser interface(두가지)
  • 위 두가지 라이브러리를 사용하여 파일을 읽을 수 있습니다.
<dependency> <groupId>org.apache.tika</groupId> <artifactId>tika-core</artifactId> <version>2.0.0-ALPHA</version> </dependency> <dependency> <groupId>org.apache.tika</groupId> <artifactId>tika-parsers</artifactId> <version>2.0.0-ALPHA</version> <type>pom</type> </dependency>
  • 위의 라이브러리를 추가 후에
notion image
 

REF

https://myhappyman.tistory.com/133
https://github.com/devheedoo/TIW/blob/master/[Java] 파일 업로드 시 MIME 타입 확인.md
https://override1592.tistory.com/14