DeepSeek-R1 Kết hợp AI và Điện toán biên cho IoT công nghiệp

Giới thiệu

Các mô hình chưng cất có kích thước nhỏ của DeepSeek-R1 được tinh chỉnh bằng cách sử dụng dữ liệu chuỗi suy nghĩ do DeepSeek-R1 tạo ra, được đánh dấu bằng...thẻ, kế thừa khả năng suy luận của R1. Các tập dữ liệu được tinh chỉnh này bao gồm rõ ràng các quy trình suy luận như phân tích vấn đề và suy luận trung gian. Học tăng cường đã căn chỉnh các mẫu hành vi của mô hình chưng cất với các bước suy luận do R1 tạo ra. Cơ chế chưng cất này cho phép các mô hình nhỏ duy trì hiệu quả tính toán trong khi vẫn có được khả năng suy luận phức tạp gần với các mô hình lớn hơn, đây là giá trị ứng dụng quan trọng trong các tình huống hạn chế về tài nguyên. Ví dụ, phiên bản 14B đạt được 92% khả năng hoàn thành mã của mô hình DeepSeek-R1 ban đầu. Bài viết này giới thiệu mô hình chưng cất DeepSeek-R1 và các ứng dụng cốt lõi của nó trong điện toán biên công nghiệp, được tóm tắt theo bốn hướng sau, cùng với các trường hợp triển khai cụ thể:

dc3c637c5bead8b62ed51b6d83ac0b4

Bảo trì dự đoán thiết bị

Triển khai kỹ thuật

Hợp nhất cảm biến:

Tích hợp dữ liệu rung động, nhiệt độ và dòng điện từ PLC thông qua giao thức Modbus (tốc độ lấy mẫu 1 kHz).

Trích xuất tính năng:

Chạy Edge Impulse trên Jetson Orin NX để trích xuất các đặc điểm chuỗi thời gian 128 chiều.

Suy luận mô hình:

Triển khai mô hình DeepSeek-R1-Distill-14B, nhập các vectơ đặc trưng để tạo ra các giá trị xác suất lỗi.

Điều chỉnh động:

Kích hoạt lệnh bảo trì khi độ tin cậy > 85% và bắt đầu quy trình xác minh thứ cấp khi < 60%.

Trường hợp liên quan

Schneider Electric đã triển khai giải pháp này trên máy móc khai thác, giúp giảm tỷ lệ báo động giả tới 63% và chi phí bảo trì tới 41%.

1

Chạy mô hình DeepSeek R1 Distilled trên máy tính InHand AI Edge

Kiểm tra trực quan nâng cao

Kiến trúc đầu ra

Đường ống triển khai điển hình:

camera = GigE_Vision_Camera(500fps) # Camera công nghiệp Gigabit
frame = camera.capture() # Chụp ảnh
preprocessed = OpenCV.denoise(frame) # Khử nhiễu tiền xử lý
defect_type = DeepSeek_R1_7B.infer(đã xử lý trước) # Phân loại lỗi
nếu defect_type không phải là 'normal':
PLC.trigger_reject() # Cơ chế sắp xếp kích hoạt

Số liệu hiệu suất

Độ trễ xử lý:

82 ms (Jetson AGX Orin)

Sự chính xác:

Khả năng phát hiện lỗi đúc phun đạt tới 98,7%.

2

Ý nghĩa của DeepSeek R1: Người chiến thắng và kẻ thua cuộc trong chuỗi giá trị AI tạo ra

Tối ưu hóa luồng quy trình

Công nghệ chính

Tương tác ngôn ngữ tự nhiên:

Người vận hành mô tả các bất thường của thiết bị bằng giọng nói (ví dụ: "Biến động áp suất máy đùn ±0,3 MPa").

Lý luận đa phương thức:

Mô hình đưa ra các đề xuất tối ưu hóa dựa trên dữ liệu lịch sử của thiết bị (ví dụ: điều chỉnh tốc độ trục vít 2,5%).

Xác minh bản sao kỹ thuật số:

Xác thực mô phỏng tham số trên nền tảng EdgeX Foundry.

Hiệu ứng thực hiện

Nhà máy hóa chất của BASF đã áp dụng chương trình này, đạt được mức giảm 17% mức tiêu thụ năng lượng và tăng 9% tỷ lệ chất lượng sản phẩm.

3

Edge AI và tương lai của doanh nghiệp: OpenAI o1 so với DeepSeek R1 dành cho chăm sóc sức khỏe, ô tô và IIoT

Truy xuất ngay lập tức cơ sở kiến ​​thức

Thiết kế kiến ​​trúc

Cơ sở dữ liệu vectơ cục bộ:

Sử dụng ChromaDB để lưu trữ hướng dẫn sử dụng thiết bị và thông số kỹ thuật quy trình (kích thước nhúng 768).

Truy xuất kết hợp:

Kết hợp thuật toán BM25 + độ tương đồng cosin cho truy vấn.

Tạo kết quả:

Mô hình R1-7B tóm tắt và tinh chỉnh kết quả truy xuất.

Trường hợp điển hình

Các kỹ sư của Siemens đã giải quyết lỗi biến tần thông qua truy vấn ngôn ngữ tự nhiên, giúp giảm thời gian xử lý trung bình xuống 58%.

Thách thức và giải pháp triển khai

Giới hạn bộ nhớ:

Sử dụng công nghệ lượng tử hóa bộ nhớ đệm KV, giảm dung lượng bộ nhớ sử dụng của model 14B từ 32GB xuống 9GB.

Đảm bảo hiệu suất thời gian thực:

Độ trễ suy luận đơn được ổn định ở mức ±15 ms thông qua tối ưu hóa đồ thị CUDA.

Mô hình trôi dạt:

Cập nhật gia tăng hàng tuần (chỉ truyền 2% thông số).

Môi trường khắc nghiệt:

Được thiết kế cho phạm vi nhiệt độ rộng từ -40°C đến 85°C với cấp độ bảo vệ IP67.

5
微信图片_20240614024031.jpg1

Phần kết luận

Chi phí triển khai hiện tại đã giảm xuống còn 599 đô la/nút (Jetson Orin NX), với các ứng dụng có khả năng mở rộng hình thành trong các lĩnh vực như sản xuất 3C, lắp ráp ô tô và hóa học năng lượng. Việc tối ưu hóa liên tục kiến ​​trúc MoE và công nghệ lượng tử hóa dự kiến ​​sẽ cho phép mô hình 70B chạy trên các thiết bị biên vào cuối năm 2025.

Tìm giải pháp cáp ELV

Cáp điều khiển

Dùng cho cáp BMS, BUS, công nghiệp, thiết bị đo lường.

Hệ thống cáp có cấu trúc

Mạng & Dữ liệu, Cáp quang, Dây vá, Mô-đun, Mặt nạ

Đánh giá Triển lãm & Sự kiện năm 2024

Ngày 16-18 tháng 4 năm 2024 Trung Đông-Năng lượng tại Dubai

Ngày 16-18 tháng 4 năm 2024 Securika tại Moscow

Ngày 9 tháng 5 năm 2024 SỰ KIỆN RA MẮT SẢN PHẨM & CÔNG NGHỆ MỚI tại Thượng Hải

Ngày 22-25 tháng 10 năm 2024 AN NINH TRUNG QUỐC tại Bắc Kinh

Ngày 19-20 tháng 11 năm 2024 THẾ GIỚI KẾT NỐI KSA


Thời gian đăng: 07-02-2025