AskPDF-AI
Sistem Question Answering Dokumen PDF Berbasis Large Language Model
Berbasis Retrieval-Augmented Generation (RAG)

Pahami isi dokumen PDF Anda dengan jawaban AI yang terhubung langsung ke sumbernya.

Unggah dokumen PDF seperti jurnal, laporan, atau artikel, lalu ajukan pertanyaan secara langsung. Sistem akan mencari bagian paling relevan dari dokumen dan menghasilkan jawaban lengkap dengan rujukan halaman sehingga informasi dapat diverifikasi.

Unggah PDF untuk mulai bertanya

Maksimal 5MB, 20 halaman. Pilih mode ekstraksi yang sesuai dengan jenis PDF kamu.

Mode ekstraksi

Otomatis (Disarankan): Mencoba ekstrak teks langsung, lalu beralih ke OCR jika PDF berisi gambar/scan.

Bagaimana Sistem Bekerja?

Alur pemrosesan dokumen berbasis pendekatan RAG.

Input Pengguna
Ingestion & Preprocessing
Retrieval & Generation
Output AI
1
Unggah Dokumen
PDF lokal per sesi

Hover untuk detail

1Detail tahap

Unggah Dokumen

User memilih satu dokumen aktif untuk diproses dalam satu sesi workspace.

2
Validasi File
Tipe, ukuran, halaman

Hover untuk detail

2Detail tahap

Validasi File

Sistem memeriksa format PDF, ukuran file, jumlah halaman, dan kelayakan awal dokumen.

3
Ekstraksi Teks
PDF parser & OCR fallback

Hover untuk detail

3Detail tahap

Ekstraksi Teks

Teks diambil langsung dari PDF, lalu OCR dijalankan jika lapisan teks minim.

4
Normalisasi & Chunking
Trim, whitespace, overlap

Hover untuk detail

4Detail tahap

Normalisasi & Chunking

Teks dirapikan lalu dibagi menjadi chunk agar siap diindeks dan dicari.

5
Embedding Dokumen
Representasi semantik

Hover untuk detail

5Detail tahap

Embedding Dokumen

Setiap chunk diubah menjadi vektor numerik untuk pencarian berbasis makna.

6
Index ke Vector Store
MemoryVectorStore

Hover untuk detail

6Detail tahap

Index ke Vector Store

Vektor dan metadata chunk disimpan sementara dalam sesi aktif.

7
Insight Otomatis
Summary, key points, suggested questions

Hover untuk detail

7Detail tahap

Insight Otomatis

Sistem juga menyiapkan insight dokumen untuk mempercepat eksplorasi isi.

8
Pertanyaan Pengguna
Prompt atau follow-up

Hover untuk detail

8Detail tahap

Pertanyaan Pengguna

User mengajukan pertanyaan berbasis isi dokumen pada workspace.

9
Intent & Query Routing
Sosial vs dokumen

Hover untuk detail

9Detail tahap

Intent & Query Routing

Sistem menilai apakah pesan perlu retrieval atau cukup dibalas singkat.

10
Semantic Retrieval
Query embedding + top-k

Hover untuk detail

10Detail tahap

Semantic Retrieval

Pertanyaan user diubah menjadi embedding query, lalu dibandingkan dengan vektor chunk yang sudah diindeks untuk mengambil top-k konteks paling relevan.

11
Sintesis LLM
Jawaban berbasis konteks

Hover untuk detail

11Detail tahap

Sintesis LLM

Model generatif menyusun jawaban akhir dari pertanyaan dan konteks retrieval.

12
Jawaban & Citation
Respons + rujukan halaman

Hover untuk detail

12Detail tahap

Jawaban & Citation

User menerima jawaban, sumber halaman, dan navigasi balik ke bagian PDF.

Jalur Chat QA
Jalur Insight
Query user
Index dokumen ke retrieval
Insight muncul lebih awal
1-4

Ingestion & Preprocessing

File PDF divalidasi, diekstrak, lalu dirapikan menjadi teks yang siap dipotong menjadi chunk semantik.

5-6

Indexing Semantik

Chunk dokumen diubah menjadi embedding dan disimpan dalam vector store sesi untuk pencarian cepat.

7

Insight Otomatis

Summary, key points, dan suggested questions dibuat untuk memudahkan pemahaman dokumen segera setelah indeks siap.

8-11

Retrieval-Aware QA

Pertanyaan diroute dulu, lalu semantic retrieval memilih konteks terbaik sebelum LLM menyusun jawaban.

12

Output Terverifikasi

Jawaban akhir disertai citation halaman agar pengguna dapat menelusuri sumber informasi di PDF viewer.

Fungsionalitas Sistem

Fitur-fitur utama yang dirancang untuk mendukung proses ekstraksi dan analisis informasi dari dokumen PDF.

Tanya Jawab Berbasis Dokumen

Sistem mengekstraksi isi dokumen, mencari bagian yang relevan, dan menghasilkan jawaban berdasarkan konteks dokumen tersebut.

Rujukan Halaman

Setiap jawaban dilengkapi rujukan halaman asli, sehingga informasi yang diberikan dapat divalidasi dan diverifikasi.

Ringkasan & Analisis Otomatis

Sistem mengekstraksi poin-poin penting dari dokumen untuk menghasilkan ringkasan dan memberikan rekomendasi pertanyaan.

Dukungan PDF Teks & Scan

Dapat memproses PDF berbasis teks maupun hasil scan atau gambar karena seluruh halaman diproses dengan OCR.