AI2 выпускает Dolma, крупнейший набор данных с открытым исходным кодом для LLM