חברת השבבים Tenstorrent, בראשות ג'ים קלר, הוציאה לשוק את מעבד Wormhole מהדור הבא שלה לעומסי עבודה של בינה מלאכותית, אשר היא צופה שיציע ביצועים טובים במחיר סביר.החברה מציעה כעת שני כרטיסי PCIe נוספים שיכולים להכיל מעבד Wormhole אחד או שניים, כמו גם תחנות עבודה TT-LoudBox ו-TT-QuietBox עבור מפתחי תוכנה. כל ההכרזות של היום מכוונות למפתחים, לא לאלו המשתמשים בלוחות Wormhole לעומסי עבודה מסחריים.
"זה תמיד משמח להביא עוד מוצרים שלנו לידי מפתחים. מערכות פיתוח גרסאות המשתמשות בכרטיסי Wormhole™ שלנו יכולות לעזור למפתחים להרחיב ולפתח תוכנה רב-שבבית של בינה מלאכותית", אמר ג'ים קלר, מנכ"ל Tenstorrent.בנוסף להשקה זו, אנו נרגשים לראות את ההתקדמות שאנו עושים עם הוצאת הקלטת והפעלת מוצר הדור השני שלנו, Blackhole."

כל מעבד Wormhole מכיל 72 ליבות Tensix (חמש מהן תומכות בליבות RISC-V בפורמטים שונים) ו-108 מגה-בייט של SRAM, המספקים 262 FP8 TFLOPS בתדר של 1 גיגה-הרץ עם הספק תרמי של 160 וואט. כרטיס Wormhole n150 בעל שבב יחיד מצויד בזיכרון וידאו GDDR6 של 12 ג'יגה-בייט ובעל רוחב פס של 288 ג'יגה-בייט/שנייה.
מעבדי Wormhole מספקים גמישות גמישות להרחבה כדי לענות על צרכים מגוונים של עומסי עבודה. בתחנת עבודה סטנדרטית עם ארבעה כרטיסי Wormhole n300, ניתן לשלב את המעבדים ליחידה אחת המופיעה בתוכנה כרשת ליבה מאוחדת ורחבה של Tensix. תצורה זו מאפשרת למאיץ לטפל באותו עומס עבודה, לפצל בין ארבעה מפתחים או להריץ עד שמונה מודלים שונים של בינה מלאכותית בו זמנית. מאפיין מרכזי של גמישות זו הוא שהוא יכול לפעול באופן מקומי ללא צורך בווירטואליזציה. בסביבת מרכז נתונים, מעבדי Wormhole ישתמשו ב-PCIe להרחבה בתוך המכונה, או ב-Ethernet להרחבה חיצונית.
מבחינת ביצועים, כרטיס ה-Wormhole n150 בעל השבב היחיד של Tenstorrent (72 ליבות Tensix, תדר 1 גיגה-הרץ, 108 מגה-בייט SRAM, 12 גיגה-בייט GDDR6, רוחב פס של 288 גיגה-בייט/שנייה) השיג 262 FP8 TFLOPS בהספק של 160 וואט, בעוד שכרטיס ה-Wormhole n300 בעל השבב הכפול (128 ליבות Tensix, תדר 1 גיגה-הרץ, 192 מגה-בייט SRAM, 24 גיגה-בייט GDDR6 מצטבר, רוחב פס של 576 גיגה-בייט/שנייה) מספק עד 466 FP8 TFLOPS בהספק של 300 וואט.
כדי לשים 300W של 466 FP8 TFLOPS בהקשר, נשווה זאת למה שמובילת שוק הבינה המלאכותית Nvidia מציעה בעוצמת עיצוב תרמית זו. ה-A100 של Nvidia אינו תומך ב-FP8, אך הוא תומך ב-INT8, עם ביצועי שיא של 624 TOPS (1,248 TOPS בדלילות). לשם השוואה, ה-H100 של Nvidia תומך ב-FP8 ומגיע לביצועי שיא של 1,670 TFLOPS ב-300W (3,341 TFLOPS בדלילות), דבר השונה משמעותית מ-Wormhole n300 של Tenstorrent.
עם זאת, ישנה בעיה אחת עיקרית. כרטיס המסך Wormhole n150 של Tenstorrent נמכר במחיר של 999 דולר, בעוד ש-n300 נמכר במחיר של 1,399 דולר. לשם השוואה, כרטיס מסך יחיד מדגם Nvidia H100 נמכר במחיר של 30,000 דולר, תלוי בכמות. כמובן, איננו יודעים אם ארבעה או שמונה מעבדי Wormhole יכולים לספק את הביצועים של כרטיס מסך H300 יחיד, אך ה-TDP שלהם הוא 600W ו-1200W בהתאמה.
בנוסף לכרטיסים, Tenstorrent מציעה תחנות עבודה מוכנות מראש עבור מפתחים, כולל 4 כרטיסי n300 בגרסה הזולה יותר של TT-LoudBox מבוססת Xeon עם קירור אקטיבי, וגרסה מתקדמת של TT-QuietBox עם פונקציית קירור נוזלי מבוססת EPYC (Xiaolong).
זמן פרסום: 29 ביולי 2024