Câu trả lời nhanh
Khi Intel mua Nirvana, họ đã cho thấy niềm tin của họ rằng VLSI tương tự có vị trí của nó trong các chip biến đổi thần kinh của tương lai gần 1, 2, 3 .
Cho dù đó là vì khả năng khai thác dễ dàng hơn tiếng ồn lượng tử tự nhiên trong các mạch tương tự vẫn chưa được công khai. Có nhiều khả năng vì số lượng và độ phức tạp của các chức năng kích hoạt song song có thể được đóng gói vào một chip VLSI duy nhất. Analog có các đơn đặt hàng lợi thế lớn hơn so với kỹ thuật số trong khía cạnh đó.
Nó có khả năng có lợi cho các thành viên AI Stack Exchange để tăng tốc độ phát triển mạnh mẽ của công nghệ này.
Xu hướng quan trọng và phi xu hướng trong AI
Để tiếp cận câu hỏi này một cách khoa học, tốt nhất là đối chiếu lý thuyết tín hiệu tương tự và kỹ thuật số mà không có sự thiên vị của xu hướng.
Những người đam mê trí tuệ nhân tạo có thể tìm thấy nhiều trên web về tìm hiểu sâu, trích xuất tính năng, nhận dạng hình ảnh và các thư viện phần mềm để tải xuống và ngay lập tức bắt đầu thử nghiệm. Đó là cách mà hầu hết mọi người đều bị ướt chân với công nghệ, nhưng việc giới thiệu nhanh về AI cũng có mặt trái của nó.
Khi không hiểu được nền tảng lý thuyết của việc triển khai thành công sớm AI đối mặt với người tiêu dùng, các giả định hình thành mâu thuẫn với các nền tảng đó. Các tùy chọn quan trọng, chẳng hạn như tế bào thần kinh nhân tạo tương tự, mạng tăng vọt và phản hồi thời gian thực, bị bỏ qua. Sự cải thiện của các hình thức, khả năng và độ tin cậy bị tổn hại.
Sự nhiệt tình trong phát triển công nghệ phải luôn được tôi luyện với ít nhất một thước đo bằng nhau về tư duy duy lý.
Sự hội tụ và ổn định
Trong một hệ thống mà độ chính xác và độ ổn định đạt được thông qua phản hồi, cả giá trị tín hiệu analog và kỹ thuật số luôn chỉ là ước tính.
- Các giá trị số trong thuật toán hội tụ, hay chính xác hơn là một chiến lược được thiết kế để hội tụ
- Giá trị tín hiệu tương tự trong mạch khuếch đại hoạt động ổn định
Hiểu được sự song song giữa hội tụ thông qua sửa lỗi trong thuật toán kỹ thuật số và độ ổn định đạt được thông qua phản hồi trong thiết bị tương tự là điều quan trọng trong suy nghĩ về câu hỏi này. Đây là những tương đồng sử dụng biệt ngữ đương đại, với kỹ thuật số ở bên trái và tương tự ở bên phải.
┌┌ ─ ─ ─ Giới thiệu về giới tính của bạn
* Lưới nhân tạo kỹ thuật số * * Lưới nhân tạo tương tự *
├├ ─ ─ Giới thiệu về giới tính của bạn
Truyền lan Đường dẫn tín hiệu chính │
├├ ─ ─ Giới thiệu về giới tính của bạn
Chức năng lỗi Chức năng lỗi │
├├ ─ ─ Giới thiệu về giới tính của bạn
Hội tụ │ Ổn định
├├ ─ ─ Giới thiệu về giới tính của bạn
Độ bão hòa của độ dốc │ Độ bão hòa ở đầu vào
├├ ─ ─ Giới thiệu về giới tính của bạn
Chức năng kích hoạt function Chức năng chuyển tiếp
└└ ─ ─ Giới thiệu về giới tính của bạn
Phổ biến của mạch kỹ thuật số
Yếu tố chính trong sự gia tăng phổ biến mạch kỹ thuật số là ngăn chặn tiếng ồn. Các mạch kỹ thuật số VLSI ngày nay có thời gian trung bình dài đến thất bại (thời gian trung bình giữa các trường hợp khi gặp phải một giá trị bit không chính xác).
Việc loại bỏ nhiễu ảo đã mang lại cho mạch kỹ thuật số một lợi thế đáng kể so với mạch tương tự để đo lường, điều khiển PID, tính toán và các ứng dụng khác. Với mạch kỹ thuật số, người ta có thể đo chính xác đến năm chữ số thập phân, điều khiển với độ chính xác vượt trội và tính toán chính xác từ π đến một nghìn chữ số thập phân, lặp lại và đáng tin cậy.
Nó chủ yếu là hàng không, quốc phòng, đạn đạo và ngân sách đối phó đã làm tăng nhu cầu sản xuất để đạt được nền kinh tế quy mô trong sản xuất mạch kỹ thuật số. Nhu cầu về độ phân giải màn hình và tốc độ kết xuất đang thúc đẩy việc sử dụng GPU làm bộ xử lý tín hiệu số.
Là những lực lượng kinh tế phần lớn gây ra sự lựa chọn thiết kế tốt nhất? Các mạng nhân tạo dựa trên kỹ thuật số có sử dụng tốt nhất bất động sản VLSI quý giá không? Đó là thách thức của câu hỏi này, và nó là một câu hỏi hay.
Thực tế về độ phức tạp của IC
Như đã đề cập trong một bình luận, phải mất hàng chục ngàn bóng bán dẫn để thực hiện trong silicon một nơron mạng nhân tạo độc lập, có thể tái sử dụng. Điều này phần lớn là do phép nhân ma trận vector dẫn vào mỗi lớp kích hoạt. Chỉ mất vài chục bóng bán dẫn cho mỗi nơron nhân tạo để thực hiện phép nhân ma trận véc tơ và mảng các bộ khuếch đại hoạt động của lớp. Bộ khuếch đại hoạt động có thể được thiết kế để thực hiện các chức năng như bước nhị phân, sigmoid, soft plus, ELU và ISRLU.
Nhiễu tín hiệu số từ làm tròn
Tín hiệu số không bị nhiễu vì hầu hết các tín hiệu số được làm tròn và do đó gần đúng. Độ bão hòa của tín hiệu trong lan truyền ngược xuất hiện đầu tiên khi nhiễu kỹ thuật số được tạo ra từ phép tính gần đúng này. Bão hòa hơn nữa xảy ra khi tín hiệu luôn được làm tròn thành cùng một biểu diễn nhị phân.
veknN
v = ΣNn = 01n2k + e + N- n
Các lập trình viên đôi khi gặp phải các hiệu ứng làm tròn theo số dấu phẩy động chính xác kép hoặc đơn của IEEE khi các câu trả lời được dự kiến là 0,2 xuất hiện dưới dạng 0,20000000000001. Một phần năm không thể được biểu diễn với độ chính xác hoàn hảo dưới dạng số nhị phân vì 5 không phải là hệ số 2.
Science Over Media Hype và Xu hướng phổ biến
E= m c2
Trong học máy như với nhiều sản phẩm công nghệ, có bốn thước đo chất lượng chính.
- Hiệu quả (thúc đẩy tốc độ và tính kinh tế của việc sử dụng)
- độ tin cậy
- Sự chính xác
- Tính toàn diện (giúp duy trì khả năng bảo trì)
Đôi khi, nhưng không phải lúc nào cũng vậy, thành tích của người này thỏa hiệp với người khác, trong trường hợp đó phải cân bằng. Gradient descent là một chiến lược hội tụ có thể được thực hiện trong một thuật toán kỹ thuật số cân bằng độc đáo bốn điều này, đó là lý do tại sao nó là chiến lược chủ đạo trong đào tạo tri giác nhiều lớp và trong nhiều mạng sâu.
Bốn điều đó là trọng tâm của công việc điều khiển học sớm của Norbert Wiener trước các mạch kỹ thuật số đầu tiên trong Bell Labs hoặc lần lật đầu tiên được thực hiện với các ống chân không. Thuật ngữ điều khiển học có nguồn gốc từ tiếng Hy Lạp κυβερκυβερ (phát âm là kyvernítis ) có nghĩa là người lái, trong đó người đập và cánh buồm phải bù cho gió và dòng chảy thay đổi liên tục và con tàu cần phải hội tụ trên cảng hoặc bến cảng dự định.
Xu hướng của câu hỏi này có thể xoay quanh ý tưởng về việc liệu có thể thực hiện được VLSI để đạt được quy mô kinh tế cho các mạng tương tự hay không, nhưng tiêu chí được đưa ra bởi tác giả của nó là để tránh các quan điểm theo xu hướng. Ngay cả khi đó không phải là trường hợp, như đã đề cập ở trên, các bóng bán dẫn được yêu cầu ít hơn đáng kể để tạo ra các lớp mạng nhân tạo với mạch tương tự so với kỹ thuật số. Vì lý do đó, việc trả lời câu hỏi giả định rằng tương tự VLSI là rất khả thi với chi phí hợp lý nếu sự chú ý hướng đến việc hoàn thành nó là hợp pháp.
Thiết kế mạng nhân tạo tương tự
Lưới nhân tạo tương tự đang được điều tra trên toàn thế giới, bao gồm liên doanh IBM / MIT, Nirvana của Intel, Google, Không quân Hoa Kỳ vào đầu năm 1992 5 , Tesla và nhiều người khác, một số người nêu trong các nhận xét và phụ lục về điều này câu hỏi
Sự quan tâm đến tương tự đối với các mạng nhân tạo có liên quan đến số lượng các chức năng kích hoạt song song liên quan đến việc học có thể phù hợp với một milimet vuông của bất động sản chip VLSI. Điều đó phụ thuộc phần lớn vào số lượng bóng bán dẫn được yêu cầu. Các ma trận suy giảm (ma trận tham số học tập) 4 yêu cầu nhân vectơ ma trận, đòi hỏi một số lượng lớn các bóng bán dẫn và do đó là một khối đáng kể của bất động sản VLSI.
Phải có năm thành phần chức năng độc lập trong một mạng lưới tri giác đa lớp cơ bản nếu nó có sẵn để đào tạo song song hoàn toàn.
- Phép nhân vectơ ma trận tham số hóa biên độ truyền về phía trước giữa các hàm kích hoạt của mỗi lớp
- Việc lưu giữ các tham số
- Các chức năng kích hoạt cho mỗi lớp
- Việc giữ lại các đầu ra của lớp kích hoạt để áp dụng trong lan truyền ngược
- Đạo hàm của các hàm kích hoạt cho mỗi lớp
Trong mạch tương tự, với sự song song lớn hơn vốn có trong phương pháp truyền tín hiệu, 2 và 4 có thể không cần thiết. Lý thuyết phản hồi và phân tích điều hòa sẽ được áp dụng cho thiết kế mạch, sử dụng một trình giả lập như Spice.
cpc ( ∫r )r ( t , c )tTôiTôiwTôi τpτmộtτd
c = cpc ( ∫r ( t , c )dt )( ∑Tôi- 2i = 0( τpwTôiwtôi - 1+ τmộtwTôi+ τdwTôi) + ΤmộtwTôi- 1+ τdwTôi- 1)
Đối với các giá trị chung của các mạch này trong các mạch tích hợp tương tự hiện tại, chúng tôi có chi phí cho các chip VLSI tương tự hội tụ theo thời gian với giá trị ít nhất ba bậc độ lớn so với các chip kỹ thuật số có độ song song đào tạo tương đương.
Địa chỉ trực tiếp tiêm tiếng ồn
Câu hỏi nêu rõ: "Chúng tôi đang sử dụng độ dốc (Jacobian) hoặc mô hình độ hai (Hessian) để ước tính các bước tiếp theo trong thuật toán hội tụ và cố tình thêm nhiễu [hoặc] gây nhiễu giả ngẫu nhiên để cải thiện độ tin cậy hội tụ bằng cách nhảy ra khỏi giếng địa phương trong lỗi bề mặt trong quá trình hội tụ. "
Lý do nhiễu giả ngẫu nhiên được đưa vào thuật toán hội tụ trong quá trình đào tạo và trong các mạng tái sử dụng thời gian thực (như mạng gia cố) là do sự tồn tại của cực tiểu cục bộ trong bề mặt chênh lệch (lỗi) không phải là cực tiểu toàn cầu. bề mặt. Cực tiểu toàn cầu là trạng thái được đào tạo tối ưu của mạng nhân tạo. Cực tiểu địa phương có thể là xa tối ưu.
Bề mặt này minh họa chức năng lỗi của các tham số (hai trong trường hợp 6 được đơn giản hóa cao này ) và vấn đề cực tiểu cục bộ che giấu sự tồn tại của cực tiểu toàn cầu. Các điểm thấp trên bề mặt thể hiện cực tiểu tại các điểm tới hạn của các khu vực địa phương về sự hội tụ đào tạo tối ưu. 7,8
Các hàm lỗi chỉ đơn giản là thước đo sự chênh lệch giữa trạng thái mạng hiện tại trong quá trình đào tạo và trạng thái mạng mong muốn. Trong quá trình đào tạo mạng nhân tạo, mục tiêu là tìm ra mức tối thiểu toàn cầu của sự chênh lệch này. Bề mặt như vậy tồn tại cho dù dữ liệu mẫu được dán nhãn hoặc không được gắn nhãn và liệu các tiêu chí hoàn thành đào tạo là bên trong hay bên ngoài mạng nhân tạo.
Nếu tốc độ học tập nhỏ và trạng thái ban đầu là ở gốc của không gian tham số, thì sự hội tụ, sử dụng độ dốc, sẽ hội tụ đến giếng ngoài cùng, là mức tối thiểu cục bộ, không phải là mức tối thiểu toàn cầu ở bên phải.
Ngay cả khi các chuyên gia khởi tạo mạng nhân tạo để học đủ thông minh để chọn điểm giữa giữa hai cực tiểu, thì độ dốc tại điểm đó vẫn dốc về phía tối thiểu bên tay trái và sự hội tụ sẽ đến trạng thái đào tạo không tối ưu. Nếu sự tối ưu của đào tạo là rất quan trọng, điều thường thấy, đào tạo sẽ không đạt được kết quả chất lượng sản xuất.
Một giải pháp được sử dụng là thêm entropy vào quá trình hội tụ, thường chỉ đơn giản là tiêm đầu ra suy yếu của bộ tạo số ngẫu nhiên giả. Một giải pháp khác ít được sử dụng là phân nhánh quá trình đào tạo và thử tiêm một lượng lớn entropy trong quy trình hội tụ thứ hai để có một tìm kiếm bảo thủ và một tìm kiếm hơi hoang dã chạy song song.
Đúng là nhiễu lượng tử trong các mạch tương tự cực nhỏ có độ đồng đều cao hơn phổ tín hiệu từ entropy của nó so với máy phát giả ngẫu nhiên kỹ thuật số và cần ít bóng bán dẫn hơn để đạt được nhiễu chất lượng cao hơn. Liệu những thách thức trong việc thực hiện VLSI đã được khắc phục hay chưa vẫn chưa được tiết lộ bởi các phòng thí nghiệm nghiên cứu được nhúng trong các chính phủ và tập đoàn.
- Các yếu tố ngẫu nhiên như vậy được sử dụng để tiêm số lượng ngẫu nhiên đo được để tăng cường tốc độ và độ tin cậy đào tạo có thể miễn nhiễm với tiếng ồn bên ngoài trong quá trình đào tạo không?
- Họ sẽ được bảo vệ đầy đủ khỏi cuộc nói chuyện chéo nội bộ?
- Liệu một nhu cầu phát sinh sẽ làm giảm chi phí sản xuất VLSI đủ để đạt đến điểm sử dụng lớn hơn bên ngoài các doanh nghiệp nghiên cứu được tài trợ cao?
Cả ba thử thách đều hợp lý. Điều chắc chắn và cũng rất thú vị là cách các nhà thiết kế và nhà sản xuất tạo điều kiện cho việc điều khiển kỹ thuật số các đường dẫn tín hiệu tương tự và các chức năng kích hoạt để đạt được tốc độ đào tạo cao.
Chú thích
[1] https://ieeexplore.ieee.org/abab/document/8401400/
[2] https://spectrum.ieee.org/automaton/robotics/art bát-intellect / analog-and-neuromorphic-chips-will-rule -robotic-agage
[3] https://www.roboticstomorrow.com/article/2018/04/whats-the-difference-b between-analog-and-neuromorphic-chips-in-robots/11820
[4] Sự suy giảm liên quan đến việc nhân một đầu ra tín hiệu từ một lần truyền động bằng một tham số có thể huấn luyện để cung cấp một phần bổ sung được tổng hợp với các phần khác cho đầu vào để kích hoạt lớp tiếp theo. Mặc dù đây là một thuật ngữ vật lý, nó thường được sử dụng trong kỹ thuật điện và nó là thuật ngữ thích hợp để mô tả chức năng của phép nhân ma trận véc tơ đạt được những gì, trong các vòng tròn ít giáo dục, được gọi là trọng số của các đầu vào lớp.
[5] http://www.dtic.mil/dtic/tr/fulltext/u2/a256621.pdf
[6] Có nhiều hơn hai tham số trong các mạng nhân tạo, nhưng chỉ có hai tham số được mô tả trong hình minh họa này vì cốt truyện chỉ có thể hiểu được trong 3-D và chúng tôi cần một trong ba chiều cho giá trị hàm lỗi.
z= ( X - 2 )2+ ( y- 2 )2+ 60 - 401 + ( y- 1.1 )2+ ( x - 0,9 )2√- 40( 1 + ( ( y- 2.2 )2+ ( x - 3,1 )2)4)
[8] Các lệnh gnuplot liên kết:
set title "Error Surface Showing How Global Optimum Can be Missed"
set xlabel "x"
set ylabel "y"
set pm3d at b
set ticslevel 0.8
set isosample 40,40
set xrange [0:4]
set yrange [0:4]
set nokey
splot (x-2)**2 + (y-2)**2 + 60 \
- 40 / sqrt(1+(y-1.1)**2+(x-0.9)**2) \
- 40 / (1+(y-2.2)**2+(x-3.1)**2)**4