Lechen Zhang

leczhang

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

On Many-Shot In-Context Learning for Long-Context Evaluation

liked a dataset about 2 months ago

launch/ExpertLongBench

upvoted a paper about 2 months ago

VeriFact: Enhancing Long-Form Factuality Evaluation with Refined Fact Extraction and Reference Facts

View all activity

Organizations

upvoted a paper about 1 month ago

On Many-Shot In-Context Learning for Long-Context Evaluation

Paper • 2411.07130 • Published Nov 11, 2024 • 7

liked a dataset about 2 months ago

launch/ExpertLongBench

Preview • Updated 8 days ago • 213 • 8

upvoted 2 papers about 2 months ago

VeriFact: Enhancing Long-Form Factuality Evaluation with Refined Fact Extraction and Reference Facts

Paper • 2505.09701 • Published May 14 • 2

ExpertLongBench: Benchmarking Language Models on Expert-Level Long-Form Generation Tasks with Structured Checklists

Paper • 2506.01241 • Published Jun 2 • 9

updated a dataset about 2 months ago

launch/FactBench

Viewer • Updated Jun 9 • 1k • 21 • 3

upvoted 2 papers 4 months ago

CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives

Paper • 2504.10823 • Published Apr 15 • 15

MLRC-Bench: Can Language Agents Solve Machine Learning Research Challenges?

Paper • 2504.09702 • Published Apr 13 • 18

liked 2 datasets 5 months ago

GAIR/lima

Viewer • Updated Jun 8, 2023 • 1.33k • 755 • 442

launch/FactBench

Viewer • Updated Jun 9 • 1k • 21 • 3

liked a Space 9 months ago

Factbench

📈

Display a leaderboard for evaluating language model factuality

liked a model over 1 year ago

openai/clip-vit-large-patch14

Zero-Shot Image Classification • 0.4B • Updated Sep 15, 2023 • 11.2M • 1.82k

Lechen Zhang

AI & ML interests

Recent Activity

Organizations

leczhang's activity

Factbench