Deepseek-R1 kết hợp AI và tính toán cạnh cho IoT công nghiệp

Giới thiệu

Các mô hình chưng cất có kích thước nhỏ của DeepSeek-R1 được tinh chỉnh bằng cách sử dụng dữ liệu chuỗi suy nghĩ được tạo ra bởi DeepSeek-R1, được đánh dấu bằng...Tags, kế thừa khả năng lý luận của R1. Các bộ dữ liệu được điều chỉnh tốt này bao gồm các quy trình lý luận như phân tách vấn đề và các khoản khấu trừ trung gian. Học tập củng cố đã phù hợp với các mẫu hành vi của mô hình chưng cất với các bước lý luận được tạo bởi R1. Cơ chế chưng cất này cho phép các mô hình nhỏ duy trì hiệu quả tính toán trong khi có được các khả năng lý luận phức tạp gần các mô hình lớn hơn, có giá trị ứng dụng đáng kể trong các kịch bản bị hạn chế tài nguyên. Chẳng hạn, phiên bản 14B đạt được 92% mã hoàn thành mã của mô hình DeepSeek-R1 ban đầu. Bài viết này giới thiệu mô hình chưng cất DeepSeek-R1 và các ứng dụng cốt lõi của nó trong điện toán cạnh công nghiệp, được tóm tắt theo bốn hướng sau, cùng với các trường hợp thực hiện cụ thể:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Bảo trì dự đoán thiết bị

Thực hiện kỹ thuật

Phản ứng tổng hợp cảm biến:

Tích hợp độ rung, nhiệt độ và dữ liệu hiện tại từ PLC thông qua giao thức Modbus (tốc độ lấy mẫu 1 kHz).

Khai thác tính năng:

Chạy xung cạnh trên Jetson Orin NX để trích xuất các tính năng chuỗi thời gian 128 chiều.

Suy luận mô hình:

Triển khai mô hình DeepSeek-R1-Distill-14B, nhập các vectơ tính năng để tạo các giá trị xác suất lỗi.

Điều chỉnh động:

Kích hoạt đơn đặt hàng công việc bảo trì khi niềm tin> 85%và bắt đầu quy trình xác minh thứ cấp khi <60%.

Trường hợp liên quan

Schneider Electric đã triển khai giải pháp này trên máy móc khai thác, giảm tỷ lệ dương tính giả 63% và chi phí bảo trì 41%.

1

Chạy mô hình chưng cất DeepSeek R1 trên máy tính AI Edge

Tăng cường kiểm tra trực quan

Kiến trúc đầu ra

Đường ống triển khai điển hình:

camera = gige_vision_camera (500fps) # camera công nghiệp Gigabit
frame = camera.capture () # chụp ảnh
Ghế được xử lý = opencv.denoise (khung) # xử lý tiền xử lý
defect_type = DeepSeek_R1_7B.infer (tiền xử lý) # Phân loại lỗi
Nếu defect_type! = 'Bình thường':
Plc.trigger_reject () # cơ chế sắp xếp kích hoạt

Số liệu hiệu suất

Độ trễ xử lý:

82 ms (Jetson Agx Orin)

Sự chính xác:

Phát hiện khuyết tật đúc đạt 98,7%.

2

Ý nghĩa của DeepSeek R1: Người chiến thắng và người thua trong chuỗi giá trị AI tổng quát

Tối ưu hóa dòng chảy quá trình

Công nghệ chính

Tương tác ngôn ngữ tự nhiên:

Các nhà khai thác mô tả sự bất thường của thiết bị thông qua giọng nói (ví dụ: "Biến động áp suất đùn ± 0,3 MPa").

Lý luận đa phương thức:

Mô hình tạo ra các đề xuất tối ưu hóa dựa trên dữ liệu lịch sử thiết bị (ví dụ, điều chỉnh tốc độ vít 2,5%).

Xác minh sinh đôi kỹ thuật số:

Xác thực mô phỏng tham số trên nền tảng Edgex Foundry.

Hiệu ứng thực hiện

Nhà máy hóa chất của BASF đã áp dụng chương trình này, đạt được mức giảm 17% mức tiêu thụ năng lượng và tăng tỷ lệ chất lượng sản phẩm.

3

EDGE AI và tương lai của doanh nghiệp: Openai O1 so với Deepseek R1 cho chăm sóc sức khỏe, ô tô và IIoT

Truy xuất ngay lập tức cơ sở kiến ​​thức

Thiết kế kiến ​​trúc

Cơ sở dữ liệu vector cục bộ:

Sử dụng ChromADB để lưu trữ hướng dẫn sử dụng thiết bị và thông số kỹ thuật quy trình (nhúng kích thước 768).

Truy xuất lai:

Kết hợp BM25 Thuật toán + tương tự cosine cho truy vấn.

Tạo kết quả:

Mô hình R1-7B tóm tắt và tinh chỉnh kết quả truy xuất.

Trường hợp điển hình

Các kỹ sư của Siemens đã giải quyết các lỗi biến tần thông qua các truy vấn ngôn ngữ tự nhiên, giảm 58%thời gian xử lý trung bình.

Thách thức và giải pháp triển khai

Hạn chế bộ nhớ:

Sử dụng công nghệ lượng tử hóa bộ đệm KV, giảm sử dụng bộ nhớ của mô hình 14b từ 32GB xuống còn 9GB.

Đảm bảo hiệu suất thời gian thực:

Ổn định độ trễ suy luận đơn đến ± 15 ms thông qua tối ưu hóa đồ thị CUDA.

Mô hình trôi dạt:

Cập nhật gia tăng hàng tuần (chỉ truyền 2% tham số).

Môi trường cực đoan:

Được thiết kế cho phạm vi nhiệt độ rộng từ -40 ° C đến 85 ° C với mức bảo vệ IP67.

5
_20240614024031.jpg1

Phần kết luận

Chi phí triển khai hiện tại hiện đã giảm xuống còn $ 599/nút (Jetson Orin NX), với các ứng dụng có thể mở rộng hình thành trong các lĩnh vực như sản xuất 3C, lắp ráp ô tô và hóa học năng lượng. Tối ưu hóa liên tục của kiến ​​trúc MOE và công nghệ lượng tử hóa dự kiến ​​sẽ cho phép mô hình 70B chạy trên các thiết bị cạnh vào cuối năm 2025.

Tìm giải pháp cáp ELV

Cáp điều khiển

Đối với BMS, xe buýt, công nghiệp, cáp thiết bị.

Hệ thống cáp có cấu trúc

Mạng & Dữ liệu, cáp quang, dây vá, mô-đun, tấm mặt

2024 Đánh giá Triển lãm & Sự kiện

Ngày 18 tháng 4 đến 18, 2024 Trung Đông năng lượng ở Dubai

Ngày 18 tháng 4 đến 18, 2024 Securika tại Moscow

Tháng 5, 2024 Sự kiện ra mắt sản phẩm & công nghệ mới tại Thượng Hải

Ngày 2 tháng 10 đến ngày 25 tháng 10 năm 2024 Trung Quốc an ninh ở Bắc Kinh

19-20/2019, 2024 KSA thế giới kết nối


Thời gian đăng: Tháng 2 năm 07-2025