[C1.S7.Ep9] Tương lai của High Performance Computing: 2nm, 3D Packaging và kiến trúc hậu-Moore

Công Nghệ 04-03-2026

Mục lục

1. Moore’s Law đang chậm lại nhưng chưa kết thúc
2. Mục tiêu mới: hàng nghìn tỷ transistor trên một hệ thống
3. Kiến trúc hậu-Moore: hiệu năng đến từ hệ thống, không chỉ từ chip
4. Các hệ thống tính toán mới đang xuất hiện
5. Tương lai của hệ thống tính toán
6. Kết luận
7. Danh mục bài viết cùng chuyên đề

Trong nhiều thập kỷ, sức mạnh của hệ thống máy tính được thúc đẩy bởi một quy luật nổi tiếng trong ngành bán dẫn: Moore’s Law. Quy luật này quan sát rằng số lượng transistor trên một vi mạch có xu hướng tăng gấp đôi sau khoảng mỗi hai năm, trong khi chi phí cho mỗi transistor lại giảm xuống. Nhờ đó, các bộ xử lý ngày càng mạnh hơn, nhỏ hơn và rẻ hơn.

Tuy nhiên, khi ngành công nghiệp bán dẫn tiến tới các tiến trình cực nhỏ như 3 nanomet và 2 nanomet, việc tiếp tục thu nhỏ transistor trở nên khó khăn hơn. Các giới hạn vật lý như hiệu ứng lượng tử, tỏa nhiệt và chi phí sản xuất khiến tốc độ tiến triển của Moore’s Law chậm lại.

Điều này đặt ra một câu hỏi lớn cho tương lai của hệ thống tính toán: nếu không thể tiếp tục tăng hiệu năng chỉ bằng cách thu nhỏ transistor, công nghệ sẽ tiến lên theo hướng nào? Câu trả lời đang dần hình thành thông qua các hướng phát triển mới như kiến trúc hậu-Moore, đóng gói 3D, và các hệ thống tính toán quy mô cực lớn.

Moore’s Law đang chậm lại nhưng chưa kết thúc

Vai trò lịch sử của Moore’s Law trong sự phát triển của hệ thống tính toán

Từ những năm 1960, ngành công nghiệp bán dẫn đã phát triển dựa trên một quan sát quan trọng được Gordon Moore đưa ra. Ông nhận thấy rằng số lượng transistor trên một vi mạch có xu hướng tăng nhanh theo thời gian, đồng thời chi phí cho mỗi transistor lại giảm xuống. Quan sát này dần trở thành nền tảng cho sự phát triển của toàn bộ ngành công nghiệp máy tính. Trong nhiều thập kỷ, mỗi thế hệ vi xử lý mới đều sở hữu mật độ transistor cao hơn thế hệ trước. Điều này giúp High Performance Computing, HPC, transistor, Moore’s Law trở thành những khái niệm gắn liền với tiến trình tăng trưởng của sức mạnh tính toán.

Nhờ sự gia tăng liên tục của transistor, các bộ xử lý có thể thực hiện nhiều phép toán hơn trong cùng một chu kỳ xử lý. Điều này tác động trực tiếp đến hiệu năng của các hệ thống máy tính, từ máy tính cá nhân đến các hệ thống tính toán quy mô lớn. Khi số lượng transistor tăng lên, các nhà thiết kế chip có thể tích hợp thêm nhiều thành phần quan trọng như bộ nhớ đệm, đơn vị xử lý logic và các mạch điều khiển phức tạp hơn. Sự mở rộng này tạo ra các bộ xử lý có khả năng xử lý dữ liệu nhanh hơn và hiệu quả hơn.

Trong suốt nhiều năm, sự tăng trưởng theo Moore’s Law gần như trở thành quy luật mặc định của ngành công nghệ. Các công ty bán dẫn thiết kế lộ trình phát triển sản phẩm dựa trên giả định rằng mật độ transistor sẽ tiếp tục tăng theo chu kỳ ổn định. Điều này cũng giúp thúc đẩy sự phát triển của các hệ thống High Performance Computing khi các bộ xử lý ngày càng mạnh hơn và có thể phục vụ các bài toán tính toán phức tạp.

Những giới hạn vật lý khiến Moore’s Law chậm lại

Khi các tiến trình sản xuất chip tiến đến các kích thước cực nhỏ, việc tiếp tục thu nhỏ transistor bắt đầu gặp phải nhiều giới hạn vật lý. Trong giai đoạn trước năm 2015, các tiến bộ trong công nghệ bán dẫn vẫn cho phép mật độ transistor tăng đều đặn. Tuy nhiên, khi kích thước transistor tiến gần đến cấp độ nguyên tử, những thách thức mới xuất hiện và làm chậm lại tốc độ tăng trưởng của Moore’s Law, transistor, High Performance Computing, CPU GPU.

Một trong những vấn đề quan trọng là hiện tượng quantum tunnelling. Khi kích thước transistor trở nên quá nhỏ, các electron có thể vượt qua lớp cách điện của transistor ngay cả khi transistor ở trạng thái tắt. Điều này làm giảm khả năng kiểm soát dòng điện và ảnh hưởng trực tiếp đến độ ổn định của vi mạch. Ngoài ra, mật độ transistor ngày càng cao cũng làm gia tăng lượng nhiệt sinh ra trong quá trình xử lý. Khi các vi mạch hoạt động với mật độ cao, việc kiểm soát nhiệt độ trở thành một thách thức lớn đối với các hệ thống tính toán.

Chi phí sản xuất cũng là một yếu tố quan trọng khiến tốc độ phát triển chậm lại. Các tiến trình sản xuất tiên tiến yêu cầu thiết bị quang khắc cực kỳ phức tạp và chi phí đầu tư rất lớn. Khi kích thước transistor giảm xuống mức vài nanomet, việc sản xuất hàng loạt trở nên ngày càng khó khăn và tốn kém. Những yếu tố này khiến tốc độ tăng trưởng của Moore’s Law không còn duy trì được nhịp độ như trước đây.

Sự chuyển dịch từ thu nhỏ transistor sang kiến trúc hệ thống

Mặc dù tốc độ thu nhỏ transistor đã chậm lại, điều này không có nghĩa là sự phát triển của công nghệ tính toán dừng lại. Thay vào đó, ngành công nghiệp đang chuyển sang các phương pháp khác để tiếp tục nâng cao hiệu năng. Thay vì chỉ tập trung vào việc thu nhỏ transistor, các nhà thiết kế hệ thống đang tìm cách cải thiện hiệu năng thông qua kiến trúc hệ thống và các phương pháp xử lý song song. Điều này khiến High Performance Computing, HPC, parallel computing, compute nodes trở thành hướng phát triển quan trọng trong các hệ thống hiện đại.

Trong các hệ thống tính toán quy mô lớn, hiệu năng không còn phụ thuộc vào một bộ xử lý đơn lẻ. Thay vào đó, nhiều bộ xử lý được kết nối với nhau để cùng thực hiện một bài toán. Các hệ thống High Performance Computing thường bao gồm nhiều compute node, mỗi node chứa nhiều lõi xử lý CPU hoặc GPU. Những node này được kết nối với nhau thông qua các mạng tốc độ cao để trao đổi dữ liệu trong quá trình tính toán.

Cách tiếp cận này cho phép hệ thống giải quyết các bài toán phức tạp bằng cách chia nhỏ công việc thành nhiều phần. Mỗi phần được xử lý song song bởi nhiều bộ xử lý khác nhau. Nhờ đó, hiệu năng tổng thể của hệ thống có thể tăng lên đáng kể mà không cần phụ thuộc hoàn toàn vào việc thu nhỏ transistor. Đây là một trong những lý do khiến các hệ thống High Performance Computing trở thành nền tảng quan trọng trong nhiều lĩnh vực khoa học và công nghệ hiện đại.

Công nghệ bán dẫn vẫn tiếp tục tiến về các tiến trình nhỏ hơn

Mặc dù Moore’s Law đang chậm lại, ngành công nghiệp bán dẫn vẫn tiếp tục nghiên cứu các tiến trình sản xuất tiên tiến để tăng mật độ transistor. Các công ty sản xuất chip vẫn đang phát triển các công nghệ mới nhằm tiếp tục mở rộng khả năng tích hợp transistor trên một vi mạch. Những tiến trình sản xuất như 2 nanomet đang được nghiên cứu và dự kiến sẽ xuất hiện trong các thế hệ chip tương lai. Những bước tiến này tiếp tục liên quan chặt chẽ đến Moore’s Law, transistor, High Performance Computing, hạ tầng tính toán.

Sự gia tăng mật độ transistor cho phép tích hợp nhiều thành phần xử lý hơn trên một con chip. Điều này giúp các bộ xử lý có thể thực hiện nhiều phép toán hơn trong cùng một khoảng thời gian. Khi kết hợp với các kiến trúc hệ thống hiện đại, mật độ transistor cao hơn có thể góp phần cải thiện hiệu năng của các hệ thống tính toán quy mô lớn.

Tuy nhiên, các nhà thiết kế hệ thống ngày càng nhận ra rằng việc thu nhỏ transistor không còn là con đường duy nhất để tăng hiệu năng. Thay vào đó, hiệu năng của các hệ thống hiện đại được tạo ra từ sự kết hợp của nhiều yếu tố như kiến trúc xử lý, mạng kết nối tốc độ cao và các hệ thống lưu trữ song song. Trong bối cảnh này, High Performance Computing đóng vai trò ngày càng quan trọng trong việc mở rộng khả năng tính toán của các hệ thống công nghệ hiện đại.

*[C1.S7.Ep9] Tương lai của High Performance Computing: 2nm, 3D Packaging và kiến trúc hậu-Moore*

Mục tiêu mới: hàng nghìn tỷ transistor trên một hệ thống

Quy mô transistor và giới hạn của kiến trúc truyền thống

Trong nhiều thập kỷ, sức mạnh của hệ thống tính toán tăng lên chủ yếu nhờ việc tăng mật độ transistor trên một vi mạch. Transistor đóng vai trò như công tắc điện tử cơ bản trong bộ xử lý, cho phép biểu diễn và xử lý các giá trị nhị phân. Khi số lượng transistor tăng lên, khả năng xử lý dữ liệu của bộ xử lý cũng tăng theo, vì nhiều mạch logic hơn có thể được tích hợp trong cùng một con chip. Trong các bộ xử lý hiện đại, con số transistor đã đạt đến mức hàng chục tỷ. Ví dụ, các bộ xử lý CPU cao cấp có thể chứa hơn hai mươi tỷ transistor, trong khi các GPU dành cho tính toán hiệu năng cao có thể vượt quá tám mươi tỷ transistor.

Sự gia tăng này từng được thúc đẩy bởi quy luật nổi tiếng là Moore’s Law, trong đó số lượng transistor trên một vi mạch có xu hướng tăng gấp đôi theo chu kỳ khoảng hai năm. Tuy nhiên, khi tiến trình bán dẫn tiến đến các kích thước rất nhỏ, việc tiếp tục duy trì tốc độ tăng trưởng này trở nên khó khăn hơn. Những giới hạn vật lý bắt đầu xuất hiện, đặc biệt là các vấn đề liên quan đến nhiệt, mật độ điện và các hiệu ứng lượng tử trong vật liệu bán dẫn. Chính vì vậy, ngành công nghiệp đang chuyển sang những hướng tiếp cận mới để tiếp tục mở rộng năng lực xử lý.

Một trong những mục tiêu dài hạn của ngành bán dẫn là xây dựng các hệ thống xử lý có thể đạt tới quy mô hàng nghìn tỷ transistor. Trong các lộ trình phát triển công nghệ, những hệ thống như vậy được dự kiến xuất hiện trong giai đoạn sau năm 2030. Việc đạt được quy mô này không chỉ phụ thuộc vào việc thu nhỏ transistor, mà còn phụ thuộc vào cách thiết kế toàn bộ hệ thống tính toán. Điều này phản ánh một sự chuyển dịch quan trọng từ việc tối ưu một con chip đơn lẻ sang việc tối ưu High Performance Computing ở cấp độ kiến trúc hệ thống.

RibbonFET và kiến trúc transistor thế hệ mới

Khi transistor ngày càng nhỏ, việc duy trì khả năng kiểm soát dòng điện trong vi mạch trở thành một thách thức lớn. Những cấu trúc transistor truyền thống bắt đầu gặp giới hạn trong việc duy trì hiệu năng và hiệu suất năng lượng ở kích thước nanomet rất nhỏ. Chính vì vậy, các nhà thiết kế chip đang phát triển các kiến trúc transistor mới nhằm cải thiện khả năng kiểm soát dòng điện và tối ưu hóa mật độ tích hợp.

Một trong những hướng phát triển đáng chú ý là kiến trúc RibbonFET. Kiến trúc này được thiết kế để cải thiện cách dòng điện di chuyển trong transistor, giúp tăng hiệu quả chuyển mạch và giảm thất thoát năng lượng. Nhờ đó, transistor có thể tiếp tục được thu nhỏ mà vẫn duy trì hiệu năng ổn định. Điều này đặc biệt quan trọng trong bối cảnh các hệ thống High Performance Computing ngày càng yêu cầu mật độ xử lý lớn hơn.

Việc chuyển sang các kiến trúc transistor mới cho thấy ngành công nghiệp bán dẫn không chỉ dựa vào việc giảm kích thước vật lý của transistor. Thay vào đó, các nhà thiết kế đang tái cấu trúc chính transistor để phù hợp với những yêu cầu của các hệ thống tính toán hiện đại. Khi số lượng transistor tiếp tục tăng lên, những cải tiến này giúp các bộ xử lý duy trì khả năng xử lý song song và hỗ trợ các khối tính toán phức tạp.

Trong các hệ thống HPC, sự cải tiến của transistor có ảnh hưởng trực tiếp đến hiệu năng tổng thể. Mỗi transistor đóng góp vào việc xây dựng các cổng logic, các đơn vị tính toán và các khối điều khiển trong bộ xử lý. Khi kiến trúc transistor được cải tiến, toàn bộ hệ thống có thể đạt hiệu quả cao hơn trong việc thực hiện các tác vụ tính toán quy mô lớn.

High NA lithography và bước tiến trong công nghệ sản xuất chip

Một yếu tố quan trọng khác giúp ngành bán dẫn tiến gần hơn tới mục tiêu hàng nghìn tỷ transistor là công nghệ sản xuất vi mạch. Trong quá trình sản xuất chip, việc khắc các cấu trúc transistor lên bề mặt silicon yêu cầu độ chính xác cực cao. Khi kích thước transistor giảm xuống mức nanomet, những công nghệ quang khắc truyền thống bắt đầu gặp giới hạn.

Để giải quyết vấn đề này, các nhà sản xuất đang phát triển các hệ thống quang khắc mới với độ chính xác cao hơn. Công nghệ High NA lithography là một trong những hướng phát triển quan trọng. Công nghệ này cho phép tạo ra các chi tiết nhỏ hơn trên bề mặt vi mạch, từ đó tăng mật độ transistor có thể tích hợp trên cùng một diện tích silicon.

Khi mật độ transistor tăng lên, các hệ thống High Performance Computing có thể tích hợp nhiều đơn vị xử lý hơn trong cùng một bộ xử lý. Điều này đặc biệt quan trọng đối với các GPU và các bộ xử lý chuyên dụng cho tính toán song song. Những hệ thống này cần số lượng lớn lõi xử lý để thực hiện các tác vụ như mô phỏng khoa học, xử lý dữ liệu lớn và huấn luyện mô hình trí tuệ nhân tạo.

Tuy nhiên, việc tăng mật độ transistor không chỉ phụ thuộc vào công nghệ khắc vi mạch. Các yếu tố như tỏa nhiệt, quản lý năng lượng và thiết kế kiến trúc cũng đóng vai trò quan trọng. Do đó, các công nghệ sản xuất chip mới thường được phát triển song song với các cải tiến trong kiến trúc hệ thống, nhằm đảm bảo rằng các bộ xử lý có thể hoạt động ổn định trong môi trường HPC có cường độ tính toán rất cao.

2.5D và 3D packaging trong kiến trúc hệ thống tính toán

Bên cạnh việc cải tiến transistor và công nghệ sản xuất chip, ngành công nghiệp bán dẫn còn tập trung vào việc thay đổi cách các chip được kết nối với nhau. Trong các thiết kế truyền thống, hầu hết các thành phần xử lý được đặt trên cùng một mặt phẳng. Tuy nhiên, khi mật độ transistor tăng lên và nhu cầu tính toán ngày càng lớn, cách tiếp cận này bắt đầu bộc lộ những hạn chế.

Các công nghệ 2.5D và 3D packaging được phát triển để giải quyết vấn đề này. Thay vì đặt toàn bộ transistor trên một con chip đơn lẻ, các nhà thiết kế có thể kết hợp nhiều chip nhỏ lại với nhau trong cùng một hệ thống. Những chip này được kết nối thông qua các lớp trung gian hoặc được xếp chồng theo chiều dọc, tạo ra một kiến trúc hệ thống có mật độ xử lý cao hơn.

Cách tiếp cận này mang lại nhiều lợi ích cho các hệ thống High Performance Computing. Khi các chip được đặt gần nhau hơn, khoảng cách truyền dữ liệu giữa các bộ xử lý giảm xuống đáng kể. Điều này giúp tăng tốc độ trao đổi dữ liệu và giảm độ trễ trong quá trình tính toán song song.

Ngoài ra, kiến trúc đóng gói đa chiều còn cho phép tích hợp nhiều loại bộ xử lý khác nhau trong cùng một hệ thống. Ví dụ, một hệ thống có thể kết hợp CPU, GPU và các bộ gia tốc chuyên dụng trong cùng một cấu trúc đóng gói. Điều này giúp các cụm HPC đạt hiệu năng cao hơn khi xử lý các bài toán phức tạp yêu cầu nhiều loại tính toán khác nhau.

Những công nghệ packaging này cho thấy một xu hướng rõ ràng trong tương lai của ngành tính toán. Thay vì chỉ tập trung vào việc cải thiện một con chip đơn lẻ, các nhà thiết kế đang xây dựng những hệ thống xử lý lớn hơn, nơi nhiều bộ xử lý hoạt động cùng nhau trong một kiến trúc parallel computing. Điều này giúp mở rộng quy mô tính toán và tiến gần hơn tới mục tiêu các hệ thống có hàng nghìn tỷ transistor.

Kiến trúc hậu-Moore: hiệu năng đến từ hệ thống, không chỉ từ chip

Giới hạn của mở rộng transistor và nhu cầu về hệ thống

Trong nhiều năm, sức mạnh của máy tính chủ yếu được cải thiện bằng cách tăng số lượng transistor trên mỗi vi mạch. Quy luật Moore’s Law từng giúp các bộ xử lý ngày càng mạnh hơn, bởi mỗi thế hệ chip mới có thể chứa nhiều transistor hơn thế hệ trước. Tuy nhiên, khi kích thước transistor tiến gần tới các mức nanomet rất nhỏ, việc tiếp tục thu nhỏ cấu trúc bán dẫn trở nên khó khăn hơn. Các yếu tố vật lý như hiệu ứng lượng tử, vấn đề tỏa nhiệt và chi phí sản xuất ngày càng lớn khiến tốc độ tiến triển của Moore’s Law bắt đầu chậm lại.

Khi khả năng mở rộng transistor không còn tăng nhanh như trước, ngành công nghệ buộc phải tìm những cách khác để cải thiện hiệu năng tính toán. Thay vì tập trung vào việc làm cho một bộ xử lý đơn lẻ mạnh hơn, xu hướng hiện nay là xây dựng các hệ thống có khả năng phối hợp nhiều thành phần xử lý cùng lúc. Trong cách tiếp cận này, sức mạnh của một hệ thống không còn đến từ một con chip đơn lẻ mà đến từ toàn bộ cấu trúc hệ thống.

Điều này dẫn tới sự xuất hiện của các kiến trúc High Performance Computing, nơi nhiều bộ xử lý, nhiều bộ tăng tốc và nhiều hệ thống bộ nhớ có thể hoạt động đồng thời. Trong các hệ thống như vậy, khả năng xử lý được mở rộng thông qua parallel computing, cho phép nhiều tác vụ được thực hiện cùng lúc thay vì tuần tự. Đây chính là nền tảng quan trọng giúp các hệ thống tính toán hiện đại tiếp tục tăng hiệu năng ngay cả khi Moore’s Law không còn tăng trưởng nhanh như trước.

Sức mạnh đến từ sự kết hợp của nhiều bộ xử lý

Trong kiến trúc tính toán hiện đại, một hệ thống có thể bao gồm nhiều compute node, mỗi node chứa các bộ xử lý CPU và GPU cùng với bộ nhớ cục bộ. Những node này được thiết kế để xử lý các phần khác nhau của một bài toán. Khi nhiều node hoạt động đồng thời, khối lượng công việc lớn có thể được chia nhỏ và xử lý song song.

Cách tiếp cận này giúp hệ thống tận dụng được sức mạnh của nhiều bộ xử lý cùng lúc. Thay vì một CPU thực hiện toàn bộ công việc theo trình tự, các tác vụ có thể được phân phối cho nhiều lõi xử lý khác nhau. Nhờ đó, tổng thời gian tính toán giảm xuống đáng kể. Đây chính là nguyên lý cơ bản của parallel computing, nơi hiệu năng được mở rộng thông qua sự phối hợp của nhiều đơn vị xử lý.

Trong các hệ thống High Performance Computing, mỗi compute node có thể chứa nhiều lõi CPU và một hoặc nhiều GPU. CPU thường chịu trách nhiệm điều phối tác vụ và xử lý các phần logic, trong khi GPU thực hiện các phép tính có tính song song cao. Khi nhiều node cùng tham gia vào một bài toán, hệ thống có thể sử dụng hàng nghìn hoặc thậm chí hàng chục nghìn lõi xử lý.

Cấu trúc này cho phép hệ thống mở rộng khả năng tính toán theo quy mô lớn. Khi cần thêm sức mạnh xử lý, các node mới có thể được bổ sung vào cụm hệ thống. Nhờ đó, kiến trúc High Performance Computing có thể mở rộng hiệu năng mà không cần phụ thuộc hoàn toàn vào việc tăng sức mạnh của một bộ xử lý đơn lẻ.

Vai trò của lưu trữ song song và dữ liệu quy mô lớn

Trong các hệ thống tính toán hiệu năng cao, khả năng xử lý không chỉ phụ thuộc vào bộ xử lý mà còn phụ thuộc vào cách dữ liệu được lưu trữ và truy cập. Khi hàng nghìn lõi xử lý hoạt động cùng lúc, hệ thống cần một cơ chế lưu trữ có thể cung cấp dữ liệu đủ nhanh cho toàn bộ cụm tính toán. Nếu tốc độ truy xuất dữ liệu quá chậm, các bộ xử lý sẽ phải chờ đợi và hiệu năng tổng thể của hệ thống sẽ giảm.

Để giải quyết vấn đề này, các hệ thống High Performance Computing sử dụng các kiến trúc parallel storage. Trong mô hình này, dữ liệu được phân tán trên nhiều thiết bị lưu trữ khác nhau. Khi hệ thống cần đọc hoặc ghi dữ liệu, nhiều thành phần lưu trữ có thể hoạt động đồng thời để cung cấp dữ liệu cho các node tính toán.

Cách tiếp cận này giúp tăng đáng kể băng thông truy xuất dữ liệu. Thay vì một thiết bị lưu trữ duy nhất phục vụ toàn bộ hệ thống, nhiều thiết bị có thể cùng tham gia vào quá trình truyền dữ liệu. Điều này đặc biệt quan trọng đối với các bài toán xử lý dữ liệu lớn, nơi lượng dữ liệu cần đọc và ghi có thể rất lớn.

Sự kết hợp giữa parallel storage và parallel computing giúp hệ thống duy trì hiệu năng ổn định ngay cả khi khối lượng dữ liệu tăng lên. Trong các hệ thống High Performance Computing, bộ xử lý và hệ thống lưu trữ được thiết kế để hoạt động cùng nhau như một kiến trúc thống nhất, nơi dữ liệu và tính toán được phân phối đồng thời trên toàn bộ cụm hệ thống.

Mạng kết nối tốc độ cao trong hệ thống tính toán quy mô lớn

Khi một hệ thống bao gồm nhiều compute node, việc truyền dữ liệu giữa các node trở thành một yếu tố quan trọng. Trong các hệ thống tính toán quy mô lớn, các node phải liên tục trao đổi dữ liệu trong quá trình xử lý song song. Nếu mạng kết nối quá chậm hoặc có độ trễ cao, quá trình phối hợp giữa các node sẽ bị gián đoạn.

Vì lý do đó, các hệ thống High Performance Computing sử dụng các mạng kết nối chuyên dụng có độ trễ rất thấp và băng thông rất cao. Một ví dụ phổ biến là công nghệ InfiniBand, cho phép các node trao đổi dữ liệu với tốc độ lên tới hàng trăm gigabit mỗi giây. Nhờ mạng kết nối này, các node có thể chia sẻ dữ liệu và đồng bộ hóa tác vụ trong quá trình tính toán.

Trong môi trường parallel computing, nhiều phần của một bài toán có thể được xử lý trên các node khác nhau. Tuy nhiên, trong nhiều trường hợp các node vẫn cần trao đổi kết quả trung gian để hoàn thành quá trình tính toán. Mạng kết nối tốc độ cao giúp đảm bảo rằng việc truyền dữ liệu giữa các node diễn ra nhanh chóng và ổn định.

Sự kết hợp giữa compute node, parallel storage và mạng InfiniBand tạo thành nền tảng của các hệ thống High Performance Computing. Trong kiến trúc này, hiệu năng của hệ thống không đến từ một thành phần duy nhất mà từ sự phối hợp đồng bộ giữa nhiều thành phần khác nhau. Chính cấu trúc hệ thống này giúp các nền tảng tính toán hiện đại tiếp tục mở rộng hiệu năng ngay cả khi Moore’s Law không còn tăng trưởng nhanh như trước.

Các hệ thống tính toán mới đang xuất hiện

Sự dịch chuyển từ sức mạnh của một bộ xử lý sang sức mạnh của toàn hệ thống

Trong nhiều năm, hiệu năng của máy tính chủ yếu được cải thiện bằng cách tăng số lượng transistor và nâng cao khả năng xử lý của từng bộ xử lý riêng lẻ. Tuy nhiên, khi quy luật High Performance Computing dần chuyển sang giai đoạn hậu Moore’s Law, cách tiếp cận này bắt đầu thay đổi. Việc tiếp tục thu nhỏ transistor đang đối mặt với nhiều giới hạn vật lý và chi phí sản xuất ngày càng cao. Chính vì vậy, ngành công nghệ đang chuyển sang một hướng phát triển khác, nơi sức mạnh xử lý không còn phụ thuộc vào một chip duy nhất mà được tạo ra từ sự phối hợp của nhiều thành phần trong cùng một hệ thống.

Trong các hệ thống hiện đại, hiệu năng tính toán được tạo ra từ sự kết hợp của nhiều compute nodes, mỗi node bao gồm CPU nhiều lõi, GPU tăng tốc và bộ nhớ tốc độ cao. Những thành phần này không hoạt động độc lập mà được kết nối với nhau thông qua các mạng tốc độ cao và cơ chế truyền dữ liệu song song. Khi một tác vụ được gửi vào hệ thống, bộ job scheduler sẽ phân chia công việc thành nhiều phần nhỏ, sau đó phân phối chúng tới các node khác nhau để xử lý đồng thời.

Cách tiếp cận này giúp hệ thống đạt hiệu năng cao hơn nhiều so với việc sử dụng một bộ xử lý đơn lẻ. Thay vì cố gắng làm cho một CPU mạnh hơn, các kiến trúc parallel computing cho phép hàng nghìn lõi xử lý hoạt động đồng thời trên cùng một bài toán. Đây chính là nền tảng của các hệ thống High Performance Computing, nơi hiệu năng được tạo ra từ quy mô và khả năng phối hợp của toàn bộ hạ tầng tính toán.

Vai trò của mạng kết nối tốc độ cao trong các hệ thống tính toán hiện đại

Một yếu tố quan trọng giúp các hệ thống tính toán quy mô lớn hoạt động hiệu quả là mạng kết nối tốc độ cao giữa các node xử lý. Trong các hệ thống máy tính thông thường, việc truyền dữ liệu giữa các thành phần không phải là vấn đề quá lớn vì số lượng bộ xử lý tương đối ít. Tuy nhiên, trong các cụm High Performance Computing, nơi hàng trăm hoặc hàng nghìn node phải trao đổi dữ liệu liên tục, tốc độ và độ trễ của mạng trở thành yếu tố quyết định.

Các hệ thống này thường sử dụng các công nghệ kết nối chuyên dụng như InfiniBand, cho phép truyền dữ liệu với băng thông cực cao và độ trễ rất thấp. Điều này giúp các node trong hệ thống có thể chia sẻ dữ liệu và đồng bộ hóa trạng thái xử lý một cách nhanh chóng. Nếu mạng kết nối quá chậm, các bộ xử lý sẽ phải chờ dữ liệu từ node khác, khiến hiệu năng toàn hệ thống giảm mạnh.

Trong kiến trúc High Performance Computing, mạng kết nối không chỉ đóng vai trò truyền dữ liệu mà còn hỗ trợ các cơ chế giao tiếp song song như MPI. Thông qua các thư viện này, các chương trình có thể trao đổi dữ liệu trực tiếp giữa các node xử lý trong quá trình tính toán. Nhờ vậy, các bài toán lớn có thể được chia thành nhiều phần nhỏ và xử lý đồng thời trên nhiều node khác nhau mà vẫn đảm bảo kết quả cuối cùng được đồng bộ chính xác.

Chính sự kết hợp giữa mạng tốc độ cao và mô hình parallel computing đã giúp các hệ thống tính toán hiện đại đạt được khả năng xử lý vượt xa các máy tính đơn lẻ.

Hệ thống lưu trữ song song và khả năng xử lý dữ liệu quy mô lớn

Bên cạnh năng lực xử lý và mạng kết nối, hệ thống lưu trữ cũng đóng vai trò quan trọng trong các môi trường tính toán hiệu năng cao. Khi các cụm High Performance Computing xử lý những bài toán quy mô lớn, lượng dữ liệu cần đọc và ghi có thể đạt tới mức petabyte hoặc thậm chí lớn hơn. Nếu hệ thống lưu trữ không đủ nhanh, toàn bộ quá trình tính toán sẽ bị chậm lại do phải chờ dữ liệu.

Để giải quyết vấn đề này, các hệ thống hiện đại sử dụng các kiến trúc parallel storage. Thay vì lưu dữ liệu trên một thiết bị duy nhất, dữ liệu được phân tán trên nhiều máy chủ lưu trữ khác nhau và được truy cập đồng thời bởi nhiều node xử lý. Điều này cho phép hệ thống đọc và ghi dữ liệu với tốc độ cao hơn nhiều so với mô hình lưu trữ truyền thống.

Các hệ thống lưu trữ song song thường sử dụng các hệ thống file chuyên dụng như Lustre, GPFS hoặc BeeGFS. Những hệ thống này được thiết kế để hỗ trợ hàng nghìn tiến trình truy cập dữ liệu cùng lúc mà vẫn đảm bảo hiệu năng ổn định. Khi một chương trình chạy trên cụm High Performance Computing, dữ liệu đầu vào có thể được phân phối tới nhiều node xử lý cùng lúc, trong khi kết quả tính toán cũng được ghi lại song song vào hệ thống lưu trữ.

Nhờ kiến trúc này, các hệ thống High Performance Computing có thể xử lý những bộ dữ liệu khổng lồ mà các máy tính thông thường không thể quản lý hiệu quả. Sự kết hợp giữa parallel storage, mạng kết nối tốc độ cao và các cụm compute nodes đã tạo ra nền tảng cho thế hệ hệ thống tính toán quy mô lớn đang được sử dụng trong nhiều lĩnh vực khoa học và công nghiệp.

Tương lai của hệ thống tính toán

Trong nhiều năm tới, ngành công nghệ sẽ không còn dựa vào một con đường duy nhất để tăng hiệu năng. Khi các giới hạn vật lý của transistor dần xuất hiện, các hệ thống tính toán bắt đầu chuyển hướng sang những mô hình kiến trúc mới. Thay vì tập trung vào một con chip đơn lẻ, hiệu năng ngày càng được tạo ra từ sự kết hợp của nhiều thành phần trong cùng một hệ thống. Xu hướng này đặc biệt rõ ràng trong các hệ thống High Performance Computing, nơi hàng nghìn lõi xử lý và bộ gia tốc có thể hoạt động cùng lúc để xử lý những khối dữ liệu khổng lồ.

Sự thay đổi này cũng gắn chặt với nhu cầu của trí tuệ nhân tạo. Các mô hình AI hiện đại đòi hỏi khả năng xử lý song song ở quy mô lớn, cùng với băng thông dữ liệu rất cao giữa các bộ xử lý. Vì vậy, tương lai của hệ thống tính toán không chỉ là câu chuyện của transistor nhỏ hơn, mà còn là câu chuyện của kiến trúc hệ thống, khả năng mở rộng và cách các thành phần trong hệ thống HPC được kết nối với nhau.

Transistor nhỏ hơn và giới hạn của Moore’s Law

Trong nhiều thập kỷ, hiệu năng của máy tính được thúc đẩy bởi việc tăng số lượng transistor trên mỗi vi mạch. Quy luật này được biết đến với tên gọi Moore’s Law. Khi số transistor tăng lên, các bộ xử lý có thể thực hiện nhiều phép tính hơn trong cùng một chu kỳ. Điều này giúp máy tính ngày càng mạnh hơn và mở ra khả năng xử lý những bài toán phức tạp hơn.

Tuy nhiên, khi kích thước transistor tiến gần tới mức nguyên tử, quá trình thu nhỏ bắt đầu gặp phải nhiều giới hạn vật lý. Những hiện tượng như hiệu ứng lượng tử và vấn đề tỏa nhiệt khiến việc tiếp tục giảm kích thước transistor trở nên khó khăn hơn. Điều này khiến tốc độ tăng trưởng của Moore’s Law chậm lại so với các giai đoạn trước. Trong bối cảnh đó, ngành công nghệ buộc phải tìm kiếm các hướng phát triển mới để duy trì sự tiến bộ của năng lực tính toán.

Một hướng đi là tiếp tục cải tiến công nghệ bán dẫn để tiến tới các tiến trình nhỏ hơn như 3 nanomet hoặc 2 nanomet. Những bước tiến này vẫn giúp tăng mật độ transistor và cải thiện hiệu năng của bộ xử lý. Tuy nhiên, chúng không còn đủ để đáp ứng toàn bộ nhu cầu tính toán của các hệ thống hiện đại. Đặc biệt trong lĩnh vực AI, các mô hình ngày càng lớn yêu cầu năng lực xử lý vượt xa khả năng của một bộ xử lý đơn lẻ. Vì vậy, cùng với việc tiếp tục thu nhỏ transistor, ngành công nghệ bắt đầu chuyển sang các mô hình kiến trúc hệ thống mới trong High Performance Computing.

Kiến trúc transistor mới và mục tiêu hàng nghìn tỷ transistor

Khi việc thu nhỏ transistor gặp nhiều giới hạn, các nhà sản xuất chip bắt đầu phát triển những kiến trúc transistor mới nhằm duy trì tốc độ tiến hóa của hệ thống tính toán. Những thiết kế này không chỉ nhằm tăng mật độ transistor mà còn cải thiện hiệu quả sử dụng năng lượng và khả năng kiểm soát dòng điện trong các vi mạch cực nhỏ.

Một trong những mục tiêu quan trọng của ngành bán dẫn trong thập kỷ tới là đạt tới quy mô hàng nghìn tỷ transistor trong một hệ thống xử lý. Các lộ trình công nghệ cho thấy rằng những hệ thống trong tương lai có thể đạt tới khoảng một nghìn tỷ transistor vào khoảng năm 2030. Khi mật độ transistor đạt tới quy mô này, khả năng xử lý của các hệ thống hệ thống HPC sẽ tăng lên đáng kể, đặc biệt trong các bài toán khoa học và trí tuệ nhân tạo.

Đối với các hệ thống AI, số lượng transistor lớn hơn đồng nghĩa với khả năng tích hợp nhiều đơn vị tính toán hơn trong cùng một hệ thống. Điều này giúp tăng tốc các phép toán ma trận và các phép tính song song vốn là nền tảng của các mô hình học máy hiện đại. Tuy nhiên, việc tăng mật độ transistor không chỉ phụ thuộc vào công nghệ bán dẫn mà còn phụ thuộc vào cách các thành phần phần cứng được tổ chức trong toàn bộ kiến trúc tính toán. Vì vậy, sự tiến hóa của transistor cần được kết hợp với các hướng phát triển khác trong hạ tầng AI.

Chiplet và packaging đa chiều

Một trong những hướng phát triển quan trọng trong kiến trúc hệ thống là việc thay đổi cách các chip được kết nối với nhau. Thay vì thiết kế một vi mạch lớn duy nhất, nhiều hệ thống hiện đại bắt đầu sử dụng mô hình chiplet, trong đó nhiều chip nhỏ được kết hợp lại để tạo thành một hệ thống xử lý lớn hơn.

Mô hình này giúp tăng hiệu năng tổng thể của hệ thống mà không cần phải sản xuất một vi mạch khổng lồ. Khi nhiều chiplet được kết nối với nhau thông qua các công nghệ đóng gói tiên tiến, dữ liệu có thể được trao đổi nhanh hơn giữa các bộ xử lý. Điều này đặc biệt quan trọng trong các hệ thống High Performance Computing, nơi nhiều bộ xử lý cần trao đổi dữ liệu liên tục để hoàn thành các nhiệm vụ song song.

Các công nghệ đóng gói mới cũng cho phép sắp xếp các thành phần phần cứng theo nhiều lớp khác nhau, thay vì chỉ nằm trên một mặt phẳng. Điều này giúp rút ngắn khoảng cách truyền dữ liệu và tăng mật độ xử lý trong cùng một hệ thống. Đối với các hệ thống AI, cách tiếp cận này giúp tăng băng thông dữ liệu giữa CPU, GPU và bộ nhớ. Khi các thành phần được kết nối chặt chẽ hơn, toàn bộ hệ thống có thể hoạt động hiệu quả hơn trong các bài toán tính toán quy mô lớn của AI infrastructure.

Hệ thống tính toán song song quy mô lớn

Một trong những thay đổi lớn nhất trong kiến trúc tính toán hiện đại là việc chuyển từ xử lý tuần tự sang xử lý song song quy mô lớn. Thay vì dựa vào một bộ xử lý duy nhất, các hệ thống hiện đại sử dụng nhiều bộ xử lý hoạt động cùng lúc để giải quyết một bài toán.

Trong các hệ thống High Performance Computing, một bài toán lớn có thể được chia thành nhiều phần nhỏ. Mỗi phần được giao cho một lõi xử lý hoặc một GPU khác nhau. Khi tất cả các phần này được xử lý song song, thời gian tính toán tổng thể có thể giảm xuống đáng kể. Đây là nguyên tắc nền tảng của parallel computing, nơi sức mạnh của hệ thống được tạo ra từ sự phối hợp của nhiều bộ xử lý.

Cách tiếp cận này đặc biệt phù hợp với các bài toán trong trí tuệ nhân tạo. Nhiều thuật toán học máy yêu cầu thực hiện hàng triệu phép toán ma trận trên những tập dữ liệu rất lớn. Khi các phép toán này được phân chia và xử lý đồng thời trên nhiều bộ xử lý, hệ thống có thể đạt hiệu năng vượt xa khả năng của một máy tính đơn lẻ. Vì vậy, trong tương lai, sự phát triển của hệ thống HPC sẽ đóng vai trò ngày càng quan trọng trong việc xây dựng các nền tảng tính toán phục vụ trí tuệ nhân tạo.

Kết luận

Trong nhiều thập kỷ, Moore’s Law đã giúp ngành công nghiệp máy tính tiến lên với tốc độ đáng kinh ngạc. Nhưng khi các giới hạn vật lý bắt đầu xuất hiện, ngành công nghệ đang bước vào một giai đoạn chuyển đổi. Thay vì chỉ dựa vào việc thu nhỏ transistor, các hướng phát triển mới như RibbonFET, 3D packaging và kiến trúc hệ thống song song đang mở ra con đường mới cho tương lai của hệ thống tính toán.

Những công nghệ này cho thấy một thực tế quan trọng: hiệu năng của máy tính trong tương lai sẽ không chỉ đến từ kích thước của transistor, mà từ cách toàn bộ hệ thống được thiết kế và kết nối với nhau.