<span class="bg-gradient-to-r from-white via-blue-100 to-purple-200 bg-clip-text text-transparent">Research Publications

BenchmarkData ScienceBiomedical Research+2

BIODSA-1K: Benchmarking Data Science Agents for Biomedical Research

Zifeng Wang, Benjamin Danek, Jimeng Sun

BenchmarkClinical trialsSystematic Review+2

TrialPanorama: Developing Large Language Models for Clinical Research Using One Million Clinical Trials

Zifeng Wang, Qiao Jin, Jiacheng Lin, Junyi Gao, Jathurshan Pradeepkumar, Pengcheng Jiang, Benjamin Danek, Zhiyong Lu, Jimeng Sun

LLMClinical trialsFoundation model

Panacea: A foundation model for clinical trial search, summarization, design, and recruitment

Jiacheng Lin, Hanwen Xu, Zifeng Wang, Sheng Wang, Jimeng Sun

LLMMedical Literature MiningSystematic Review

npj Digital Med

Accelerating clinical evidence synthesis with large language models

Wang, Zifeng and Cao, Lang and Danek, Benjamin and Jin, Qiao and Lu, Zhiyong and Sun, Jimeng

LLMMedical Literature MiningSystematic Review+1

A foundation model for human-AI collaboration in medical literature mining

Zifeng Wang, Lang Cao, Qiao Jin, Joey Chan, Nicholas Wan, Behdad Afzali, Hyun-Jin Cho, Chang-In Choi, Mehdi Emamverdi, Manjot K. Gill, Sun-Hyung Kim, Yijia Li, Yi Liu, Hanley Ong, Justin Rousseau, Irfan Sheikh, Jenny J. Wei, Ziyang Xu, Christopher M. Zallek, Kyungsang Kim, Yifan Peng, Zhiyong Lu, Jimeng Sun

Site SelectionFair RankingClinical Trials+2

Patterns

FRAMM: Fair ranking with missing modalities for clinical trial site selection

Brandon Theodorou, Lucas Glass, Cao Xiao, Jimeng Sun

LLMPromptingPatient-Trial Matching

Matching patients to clinical trials with large language models

Qiao Jin, Zifeng Wang, Charalampos S. Floudas, Fangyuan Chen, Changlin Gong, Dara Bracken-Clarke, Elisabetta Xue, Yifan Yang, Jimeng Sun & Zhiyong Lu

Patient-Trial MatchingEHR

KDD'20

COMPOSE: Cross-modal pseudo-siamese network for patient trial matching

Junyi Gao, Cao Xiao, Lucas M. Glass, Jimeng Sun

Patient-Trial MatchingEHR

AAAI'20

Doctor2Vec: Dynamic Doctor Representation Learning for Clinical Trial Recruitment

Junyi Gao, Cao Xiao, Lucas M. Glass, Jimeng Sun

LLMInstruction TuningEligibility Criteria

EMNLP'23

AutoTrial: Prompting Language Models for Clinical Trial Design

Zifeng Wang, Cao Xiao, Jimeng Sun

Trial SearchContrastive LearningDense Retrieval

EMNLP'22

Trial2Vec: Zero-Shot Clinical Trial Document Similarity Search using Self-Supervision

Zifeng Wang, Jimeng Sun

Trial OutcomeSequential Learning

ACM-BCB'23

SPOT: Sequential Predictive Modeling of Clinical Trial Outcome with Meta-Learning

Zifeng Wang, Jimeng Sun

Trial OutcomeGraph Neural Network

Patterns

HINT: Hierarchical Interaction Network for Clinical Trial Outcome Predictions

Zifeng Wang, Jimeng Sun

BenchmarkClinical TrialsMulti-Modal+1

Scientific Data

TrialBench: Multi-Modal AI-Ready Datasets for Clinical Trial Prediction

Jintai Chen, Yaojun Hu, Mingchen Cai, Yingzhou Lu, Yue Wang, Xu Cao, Miao Lin, Hongxia Xu, Jian Wu, Xiao Cao, Jimeng Sun, Yuqiang Li, Lucas Glass, Kexin Huang, Marinka Zitnik, Tianfan Fu

Foundation ModelMultimodal AIBiomedical AI+1

ICLR'24

BioBridge: Bridging Biomedical Foundation Models via Knowledge Graph

Zifeng Wang, Zichen Wang, Balasubramaniam Srinivasan, Vassilis N. Ioannidis, Huzefa Rangwala, Rishita Anubhai

Vision-Language ModelMultimodal AIClinical Note+1

EMNLP'22

MedCLIP: Contrastive Learning from Unpaired Medical Images and Text

Zifeng Wang, Jimeng Sun

Tabular LearningPatient OutcomeLLM+1

UniPredict: Large Language Models are Universal Tabular Predictors

Ruiyu Wang, Zifeng Wang, Jimeng Sun

Tabular LearningPatient OutcomeLLM+1

IJCAI'24

MediTab: Scaling Medical Tabular Data Predictors via Data Consolidation, Enrichment, and Refinement

Zifeng Wang, Chufan Gao,Cao Xiao, Jimeng Sun

Tabular LearningPatient OutcomeTransfer Learning

NeurIPS'22

TransTab: Learning Transferable Tabular Transformers Across Tables

Zifeng Wang, Jimeng Sun

Pandemic PredictionGraph Neural NetworkReal-World Evidence

JAMIA'21

STAN: Spatio-Temporal Attention Network for Pandemic Prediction using Real-World Evidence

Junyi Gao, Rakshith Sharma, Cheng Qian, Lucas M Glass, Jeffrey Spaeder, Justin Romberg, Jimeng Sun, Cao Xiao

Pandemic PredictionSpatio-temporal Prediction

Evidence-driven spatiotemporal COVID-19 hospitalization prediction with Ising dynamics

Junyi Gao, Joerg Heintz, Christina Mack, Lucas Glass, Adam Cross & Jimeng Sun

Population Health PredictionGraph Neural NetworkSpatio-temporal Prediction

WWW'22

PopNet: Real-Time Population-Level Disease Prediction with Data Latency

Junyi Gao, Cao Xiao, Lucas M. Glass, Jimeng Sun

Predictive ModelingData AugmentationData Synthesis

npj Digital Med

Improving medical machine learning models with generative balancing for equity and excellence

Brandon Theodorou, Benjamin Danek, Venkat Tummala, Shivam Pankaj Kumar, Bradley Malin, Jimeng Sun

Digital TwinVariational Autoencoder

KDD'23

TWIN: Personalized Clinical Trial Digital Twin Generation

Trisha Das, Zifeng Wang, Jimeng Sun

Synthetic DataEHRLanguage Model+1

Synthesize high-dimensional longitudinal electronic health records via hierarchical autoregressive language model

Brandon Theodorou, Cao Xiao, Jimeng Sun

Synthetic DataEHRPrompt Learning+1

EMNLP'22

PromptEHR: Conditional Electronic Healthcare Records Generation with Prompt Learning

Zifeng Wang, Jimeng Sun

Digital TwinGenerative AITrial Outcome+1

Patterns

Clinical trial outcome prediction with multi-modal generative AI

Brandon Theodorou, Zifeng Wang, Jimeng Sun