Sequence Operations
從公開來源抓 protein / gene sequence,落到 Postgres 快取後,前端就能直接搜尋、篩選、檢視與刪除。
真接後端的基因資料平台:序列快取、知識庫與 RAG 文件,三層同步、全部可驗證。
每一個模組都能直接追到後端 API、DB 快取或 RAG 文件輸出。
從公開來源抓 protein / gene sequence,落到 Postgres 快取後,前端就能直接搜尋、篩選、檢視與刪除。
把 UniProt annotation 與 PubMed 摘要整成 evidence feed,再輸出可直接送進向量資料庫的 RAG 文件片段。
把知識庫中的 annotation 與 literature 整理成 chunk 與 metadata,前端可以直接預覽後端輸出的檢索文件格式。
序列同步、知識同步,以及 RAG 文件輸出,每一塊都能對應到真實端點與資料結構。
真的會讀 `/healthz`、`/api/sequences/summary`、`/api/sequences`,也能同步與刪除 DB 紀錄。
真的會同步知識資料、讀取快取,並向 `/api/rag/documents` 產生 RAG 文件預覽。
會向 `/api/rag/documents` 讀取後端整理好的 chunk 與 metadata,直接預覽檢索文件輸出。
Sequence Vault 與 Knowledge Vault 負責建庫,RAG preview 負責把後端文件輸出直接攤在 UI 上檢查。
這個模組會從 UniProt 與 Ensembl 抓取 protein / gene sequence,寫進 Render PostgreSQL,之後頁面就直接從 DB 讀快取,不再只是靜態示範卡片。
切換 protein / gene cache,查看最新入庫紀錄與來源 metadata。
這個模組會從 ENA Portal API 抓取 sequencing run metadata,寫進 Render PostgreSQL,之後頁面就能直接查詢 study accession、sample accession、library strategy、instrument model 與 FASTQ metadata。
查看 ENA run metadata、library strategy 與 instrument 分布,直接驗證資料有沒有正確落進 DB。
這個模組把蛋白質功能註釋和 NCBI 文獻摘要存進 Render PostgreSQL,再整理成 RAG-ready documents。前端可直接搜尋證據,後端可直接輸出 chunk 與 metadata 給檢索流程。
切換 protein annotation / literature,查看 DB 快取與對應的 RAG chunk 預覽。
三個核心模組完整串接,序列、知識與文件層一起可用。
STRING DB 真實數據,可拖曳、縮放。