دیپسیک (DeepSeek): استارتاپ چینی که نحوه آموزش مدلهای هوش مصنوعی را تغییر میدهد
دیپسیک V3 با استفاده از معماری جدیدی که برای آموزش مقرون به صرفه طراحی شده، تنها به ۲.۷۸ میلیون ساعت جیپییو نیاز داشت. این زمان به طور قابل توجهی کمتر از ۳۰.۸ میلیون ساعت جیپییو مورد نیاز متا برای آموزش مدل Llama 3.1 است.