Pang Wei Koh's picture

4 9 2

Pang Wei Koh

pangwei

·

AI & ML interests

None yet

Recent Activity

authored a paper 11 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

liked a model 11 days ago

rl-research/DR-Tulu-8B

upvoted a paper 11 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

View all activity

Organizations

None yet

upvoted a paper 11 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published 12 days ago • 54

upvoted a collection 17 days ago

DR Tulu

Models and data associated with DR Tulu, http://allenai-web/papers/drtulu • 5 items • Updated 11 days ago • 30

upvoted a paper 20 days ago

RLVE: Scaling Up Reinforcement Learning for Language Models with Adaptive Verifiable Environments

Paper • 2511.07317 • Published 26 days ago • 13

upvoted a paper 7 months ago

ReasonIR: Training Retrievers for Reasoning Tasks

Paper • 2504.20595 • Published Apr 29 • 53

upvoted 2 papers 8 months ago

DataDecide: How to Predict Best Pretraining Data with Small Experiments

Paper • 2504.11393 • Published Apr 15 • 18

OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens

Paper • 2504.07096 • Published Apr 9 • 76

upvoted a paper 12 months ago

Negative Token Merging: Image-based Adversarial Feature Guidance

Paper • 2412.01339 • Published Dec 2, 2024 • 23

upvoted a paper about 1 year ago

OpenScholar: Synthesizing Scientific Literature with Retrieval-augmented LMs

Paper • 2411.14199 • Published Nov 21, 2024 • 31

upvoted a paper over 1 year ago

Scaling Retrieval-Based Language Models with a Trillion-Token Datastore

Paper • 2407.12854 • Published Jul 9, 2024 • 31