Nirmita Publications | Learning From Human Feedback: Ranking, Bandit, And Preference Optimization

Learning From Human Feedback: Ranking, Bandit, And Preference Optimization

Learning From Human Feedback: Ranking, Bandit, And Preference Optimization

ISBN :
9788181122032

Publisher :
Nirmita Publications

Subject :
Computer Science & Engineering And It

Author/Editor :
Jaspreet Behera

Language :
English

Edition :
2025

Price (₹) :
10,855.00

Book Details :

Learning From Human Feedback: Ranking, Bandit, And Preference Optimization