Xe tự lái sử dụng công nghệ CNN như thế nào

Khi còn nhỏ, tôi thích xem những bộ phim hoạt hình có những chiếc ô tô dường như tự lái. Nó khiến tôi tự hỏi liệu những chiếc xe như vậy có thể là thật hay không và liệu có những con robot nhỏ bên trong điều khiển chúng một cách kỳ diệu hay không.
Khi chúng ta già đi, xe tự lái đang trở thành hiện thực! Tôi thực sự bị mê hoặc bởi chúng. Chẳng hạn, họ có hiểu khi nào nên dừng ở biển báo dừng và đèn đỏ không? Họ thậm chí có thể nhìn thấy động vật và con người đi lại trên đường không? Và còn việc lái xe khi trời tối hoặc khi trời mưa hoặc có tuyết thì sao?
Hãy nói về xe tự lái! Đây là những chiếc xe có thể tự lái mà không cần người lái. Các công ty như Tesla và Waymo sử dụng các kỹ thuật máy tính thông minh, như học sâu, để làm cho những chiếc xe này trở nên siêu thông minh. Học sâu giúp ô tô làm được những điều thú vị, như hiểu biển báo đường và lái xe an toàn ngay cả khi thời tiết xấu. Đó là tất cả về việc sử dụng công nghệ tiên tiến để định hình cách chúng ta di chuyển trong tương lai!
Mục lục
Lịch sử
Lịch sử của ô tô tự lái cũng giống như một cuộc phiêu lưu dài đầy thú vị. Hãy tưởng tượng những năm 1920, khi xe tự lái vẫn chỉ là giấc mơ của con người. Một bộ óc sáng tạo, Francis Houdina, đã nổi bật khi tạo ra một chiếc ô tô chạy theo vạch trên đường. Tuy nhiên, nó cần những sợi dây đặc biệt ẩn dưới đường để dẫn đường.
Nguồn: theatlantic.com
Chuyển sang những năm 1980 và 1990, những bộ óc thông minh tại Đại học Carnegie Mellon đã đạt được một điều gì đó lớn lao. Họ đã phát triển những chiếc ô tô có thể “nhìn” bằng camera, giúp họ định hướng trên những con đường đông đúc trong thành phố. Những chiếc xe này giống như những nhà thám hiểm đang học hỏi, khám phá cách lái xe bằng cách quan sát xung quanh.
Sau đó, một thời điểm quan trọng đã đến vào năm 2004, trong bối cảnh là một thử thách trên sa mạc. Những chiếc xe tự lái bước vào hiện trường, cố gắng thực hiện một cuộc đua khó khăn – một cuộc đua mà họ không giành chiến thắng, nhưng đó là một sự khởi đầu. Hãy coi đó như nơi đào tạo để họ trở thành những người lái xe giỏi hơn.
Tuy nhiên, bước đột phá thực sự đã xảy ra vào những năm 2000 và 2010 khi các công ty lớn như Tesla, Uber và Google (nay là Waymo) bước vào lĩnh vực ô tô. Google bắt đầu thử nghiệm ô tô tự lái vào năm 2009. Chuyển nhanh sang năm 2015, ô tô của Tesla đã giới thiệu một tính năng mà chúng có thể tự lái một phần trên một số con đường nhất định. Chúng có thể xử lý việc lái và đi trên đường mà không cần sự kiểm soát liên tục của con người.
Khi ngày càng có nhiều công ty tham gia cuộc đua, cuộc cạnh tranh để tạo ra những chiếc xe tự lái hoàn toàn ngày càng nóng lên. Hãy tưởng tượng các nhóm nhà phát minh đang chạy đua để tạo ra những chiếc ô tô có thể lái mà không cần con người điều khiển.
Nhưng câu chuyện vẫn tiếp tục. Chúng tôi vẫn đang nghiên cứu chế tạo những chiếc ô tô có thể tự lái, điều này sẽ thay đổi cách chúng ta đi lại. Cuộc phiêu lưu này vẫn đang diễn ra và điều đó có nghĩa là chúng ta có thể có những chuyến đi an toàn hơn và dễ dàng hơn vì những chiếc xe tự lái ưa thích này đang ngày càng tốt hơn.
Xe tự lái hoạt động như thế nào?
Xe tự lái giống như những người ra quyết định siêu thông minh! Họ sử dụng máy ảnh, LiDAR, RADAR, GPS và cảm biến quán tính để thu thập dữ liệu về môi trường xung quanh. Sau đó, các thuật toán đặc biệt gọi là thuật toán học sâu xử lý dữ liệu này để hiểu những gì đang xảy ra xung quanh chúng. Dựa trên sự hiểu biết này, họ đưa ra những quyết định quan trọng để lái xe an toàn và thuận lợi.
Nguồn: arxiv.org
Nếu chúng ta muốn tìm hiểu xem xe tự lái thực sự hoạt động như thế nào, chúng ta hãy xem xét kỹ hơn bốn phần được hiển thị trong sơ đồ trên. Nó giống như việc giải một câu đố – hiểu rõ từng mảnh ghép sẽ giúp chúng ta nhìn được bức tranh toàn cảnh hơn về cách vận hành của những chiếc xe tuyệt vời này:
- Sự nhận thức
- Bản địa hóa
- Sự dự đoán
- Quyết định
- Lập kế hoạch đường dẫn cấp cao
- Trọng tài hành vi
- Bộ điều khiển chuyển động
Sự nhận thức
#1. Máy ảnh
Máy ảnh giống như đôi mắt của ô tô tự lái – chúng cực kỳ quan trọng! Chúng giúp chiếc xe biết được những gì đang xảy ra xung quanh nó. Những camera này thực hiện những công việc khác nhau, chẳng hạn như tìm hiểu xem mọi thứ là gì, tách các bộ phận khác nhau và tìm vị trí của chiếc xe.
Để đảm bảo chiếc xe không bỏ sót bất cứ điều gì, nó có camera được đặt khắp nơi – trước, sau, trái và phải. Những camera này phối hợp với nhau để tạo ra một bức tranh lớn về mọi thứ xung quanh xe. Nó giống như góc nhìn 360 độ đặc biệt của chiếc xe!
Những chiếc máy ảnh này không chỉ để trưng bày. Họ thông minh. Một số nhìn xa, tới 200 mét nên xe biết được điều gì sắp xảy ra phía trước. Những người khác tập trung vào những thứ gần đó để chiếc xe có thể chú ý đến từng chi tiết. Đội ngũ camera này giúp chiếc xe nhìn và hiểu mọi thứ, giống như một người bạn hướng dẫn nó, để nó có thể lái xe an toàn và đưa ra những lựa chọn đúng đắn.
Đôi khi, máy ảnh cực kỳ hữu ích, chẳng hạn như khi đỗ xe, vì chúng cho tầm nhìn rộng và giúp đưa ra những lựa chọn phù hợp để lái xe cẩn thận.
Nhưng chỉ sử dụng camera để quan sát mọi thứ sẽ có vấn đề, đặc biệt là trong thời tiết khắc nghiệt như sương mù, mưa lớn và vào ban đêm. Trong thời gian này, hình ảnh từ máy ảnh có thể trông kỳ lạ và lộn xộn, có thể thực sự không an toàn.
Để xử lý những tình huống khó khăn này, chúng ta cần những cảm biến đặc biệt có thể hoạt động khi trời rất tối hoặc thậm chí là ban đêm. Họ cũng có thể đo khoảng cách của mọi thứ mà không cần ánh sáng mà chúng ta có thể nhìn thấy. Khi chúng ta đặt những cảm biến này vào mắt ô tô (hệ thống nhận thức), ô tô sẽ lái xe tốt hơn trong điều kiện thời tiết xấu hoặc khi khó nhìn thấy. Vì vậy, chiếc xe có thể lái xe an toàn hơn, điều này rất tốt cho mọi người khi lái xe trên đường.
#2. LiDAR
LiDAR, có nghĩa là Phát hiện ánh sáng và Phạm vi, là một công nghệ lạ mắt sử dụng tia laser để tìm ra khoảng cách của mọi thứ. LiDAR phát ra các chùm tia laser và đo xem chúng mất bao lâu để quay trở lại từ mọi thứ.
Khi LiDAR và camera hoạt động cùng nhau, chúng giúp chiếc xe hiểu mọi thứ rõ ràng hơn. Nó tạo ra một bản đồ 3D về những gì xung quanh xe. Thông tin đặc biệt này sau đó có thể được xem xét bởi các chương trình máy tính thông minh, giúp chiếc xe đoán được những chiếc xe khác có thể làm gì. Điều này rất hữu ích khi đường khó đi, chẳng hạn như tại các ngã tư đông đúc, vì ô tô có thể quan sát các ô tô khác và lái xe an toàn.
Tuy nhiên, LiDAR có những hạn chế có thể gây ra vấn đề. Mặc dù nó hoạt động tốt vào ban đêm và trong môi trường tối, nhưng nó có thể gặp khó khăn trong điều kiện bị mưa hoặc sương mù cản trở, có khả năng dẫn đến nhận thức không chính xác. Để giải quyết những vấn đề này, chúng tôi sử dụng cả cảm biến LiDAR và RADAR cùng một lúc. Những cảm biến này cung cấp thêm thông tin giúp xe hiểu mọi thứ rõ ràng hơn. Chiếc xe có thể tự lái một cách an toàn và tốt hơn.
#3. RADAR
RADAR, viết tắt của Radio Detector and Ranging, đã được sử dụng từ lâu trong đời sống hàng ngày và cả quân đội. Ban đầu được quân đội sử dụng để phát hiện vật thể, RADAR tính toán khoảng cách bằng tín hiệu sóng vô tuyến. Ngày nay, RADAR rất quan trọng trên nhiều ô tô, đặc biệt là ô tô tự lái.
RADAR thật tuyệt vời vì nó có thể hoạt động trong mọi loại thời tiết và ánh sáng. Thay vì sử dụng tia laser, nó sử dụng sóng vô tuyến, khiến nó linh hoạt và siêu hữu ích. Tuy nhiên, RADAR được coi là một cảm biến ồn, có nghĩa là nó có thể phát hiện chướng ngại vật ngay cả khi camera không nhìn thấy vật cản nào.
Bộ não của ô tô tự lái có thể bị nhầm lẫn bởi tất cả các tín hiệu bổ sung từ RADAR mà chúng tôi gọi là “tiếng ồn”. Để khắc phục điều này, ô tô cần làm sạch thông tin RADAR để có thể đưa ra những lựa chọn tốt.
Làm sạch dữ liệu có nghĩa là sử dụng các thủ thuật đặc biệt để phân biệt tín hiệu mạnh với tín hiệu yếu, như tách những thứ quan trọng khỏi những thứ không quá quan trọng. Chiếc xe sử dụng một thủ thuật thông minh có tên Fast Fourier Transforms (FFT) để hiểu thông tin tốt hơn nữa.
RADAR và LiDAR cung cấp thông tin về các điểm đơn lẻ, giống như các dấu chấm trên giấy. Để hiểu rõ hơn về những dấu chấm này, ô tô sử dụng tính năng như phân nhóm. Giống như khi bạn ghép những thứ tương tự lại với nhau. Chiếc xe sử dụng các phương pháp thống kê thông minh, chẳng hạn như Phân cụm Euclide hoặc Phân cụm K-nghĩa, để kết hợp các dấu chấm tương tự và hiểu chúng. Điều này giúp chiếc xe có thể lái thông minh hơn và an toàn hơn.
Bản địa hóa
Trong ô tô tự lái, thuật toán định vị đóng vai trò quan trọng trong việc xác định vị trí và hướng của xe khi di chuyển, được gọi là Đo hình ảnh trực quan (VO). VO hoạt động bằng cách xác định và khớp các điểm chính trong các khung hình video liên tiếp.
Chiếc xe nhìn vào các điểm đặc biệt trong thông tin, giống như các dấu vết trên bản đồ. Sau đó, chiếc xe sử dụng số liệu thống kê gọi là SLAM để tìm hiểu mọi thứ ở đâu và chúng chuyển động như thế nào. Điều này giúp xe biết được những gì xung quanh, như đường sá và con người.
Và để làm điều này tốt hơn nữa, chiếc xe sử dụng một thứ gọi là học sâu. Nó giống như một chiếc máy tính siêu thông minh.
Những thủ thuật này giúp chiếc xe có khả năng hiểu biết mọi thứ rất tốt. Các mạng thần kinh như PoseNet và VLocNet++ tận dụng dữ liệu điểm để ước tính vị trí và hướng 3D của các vật thể. Sau đó, các vị trí và hướng 3D ước tính này có thể được sử dụng để rút ra ngữ nghĩa của cảnh, như được minh họa trong hình ảnh bên dưới. Khi ô tô sử dụng các thủ thuật toán học và máy tính thông minh, nó sẽ biết mình đang ở đâu và có những gì xung quanh. Điều này giúp xe tự lái an toàn và êm ái.
Sự dự đoán
Hiểu được trình điều khiển của con người thực sự là một nhiệm vụ phức tạp vì nó liên quan đến cảm xúc và phản ứng hơn là logic đơn giản. Bởi vì chúng ta không biết những người lái xe khác sẽ làm gì nên điều quan trọng đối với xe tự lái là phải đưa ra những dự đoán chính xác về hành động của họ. Điều này giúp đảm bảo an toàn trên đường.
Hãy tưởng tượng những chiếc xe tự lái có mắt nhìn xung quanh, giống như góc nhìn 360 độ. Điều này cho phép họ thấy mọi thứ đang diễn ra. Họ sử dụng thông tin này với việc học sâu. Chiếc xe sử dụng các kỹ thuật thông minh để dự đoán những gì người lái xe khác có thể làm. Nó tương tự như việc chơi một trò chơi mà bạn lên kế hoạch trước để làm tốt.
Các cảm biến đặc biệt trong xe tự lái giống như đôi mắt của chúng. Chúng giúp những chiếc ô tô biết những thứ trong ảnh là gì, tìm những thứ xung quanh chúng, biết chúng ở đâu và xem mọi thứ kết thúc ở đâu. Điều này giúp ô tô nhận biết những gì ở gần và đưa ra lựa chọn thông minh.
Trong quá trình đào tạo, các thuật toán deep learning mô hình hóa thông tin phức tạp từ hình ảnh và điểm dữ liệu đám mây thu được từ LiDAR và RADAR. Trong quá trình lái xe thực tế (suy luận), mô hình tương tự sẽ giúp ô tô chuẩn bị cho các chuyển động có thể xảy ra, bao gồm phanh, dừng, giảm tốc độ, chuyển làn, v.v.
Deep learning giống như một người trợ giúp thông minh cho chiếc ô tô. Điều này làm cho chiếc xe hiểu được những điều nó không chắc chắn, tìm ra vị trí của nó và lái xe tốt hơn. Điều này giúp cho việc lái xe được an toàn và khiến mọi việc diễn ra suôn sẻ hơn.
Tuy nhiên, phần khó khăn là quyết định hành động tốt nhất từ một vài lựa chọn. Việc lựa chọn những bước di chuyển phù hợp đòi hỏi phải suy nghĩ cẩn thận để xe có thể lái tốt và an toàn.
Quyết định
Xe tự lái phải đưa ra những lựa chọn quan trọng trong những tình huống khó khăn, nhưng điều đó không hề dễ dàng. Điều này là do cảm biến không phải lúc nào cũng chính xác và người đi đường có thể làm những điều không mong muốn. Xe phải đoán xem người khác sẽ làm gì và di chuyển để tránh va chạm.
Để đưa ra lựa chọn, chiếc xe cần rất nhiều thông tin. Chiếc xe thu thập thông tin này bằng cảm biến và sau đó sử dụng thuật toán học sâu để hiểu mọi thứ ở đâu và dự đoán điều gì có thể xảy ra. Bản địa hóa giúp ô tô biết vị trí ban đầu của nó, trong khi dự đoán sẽ tạo ra nhiều hành động có thể thực hiện được dựa trên môi trường.
Tuy nhiên, câu hỏi vẫn là: làm thế nào để chiếc xe chọn được hành động tốt nhất trong số rất nhiều hành động được dự đoán?
Nguồn: ngữ nghĩascholar.org
Học tăng cường sâu (DRL) là một kỹ thuật để đưa ra quyết định và nó sử dụng thuật toán có tên là Quy trình quyết định Markov (MDP). MDP rất hữu ích trong việc đoán xem mọi người trên đường có thể hành động như thế nào trong tương lai. Khi có nhiều thứ di chuyển xung quanh, mọi thứ trở nên phức tạp hơn. Điều này có nghĩa là xe tự lái phải cân nhắc nhiều hành động khả thi hơn nữa.
Để giải quyết thách thức tìm ra hướng di chuyển tốt nhất cho ô tô, mô hình học sâu được tối ưu hóa bằng cách sử dụng tối ưu hóa Bayesian. Trong một số trường hợp, một khung kết hợp Mô hình Markov ẩn và Tối ưu hóa Bayes được sử dụng để ra quyết định, cho phép xe tự lái điều hướng hiệu quả và an toàn trong nhiều tình huống phức tạp khác nhau.
Nguồn: arxiv.org
Việc ra quyết định trong xe tự lái tuân theo quy trình phân cấp với bốn thành phần chính:
Lập kế hoạch đường đi hoặc lộ trình: Khi bắt đầu hành trình, ô tô sẽ xác định tuyến đường tốt nhất từ vị trí hiện tại đến đích mong muốn. Mục tiêu là tìm ra giải pháp tối ưu trong số các tuyến đường có thể khác nhau.
Trọng tài hành vi: Xe phải lái qua tuyến đường sau khi đã lên kế hoạch. Ô tô nhận biết được các vật thể tĩnh như đường và ngã tư, nhưng không thể đoán trước được hành động chính xác của những người lái xe khác. Để xử lý sự không chắc chắn này, chúng tôi sử dụng các phương pháp thông minh như Quy trình Quyết định Markov (MDP) để lập kế hoạch.
Quyết định kịch bản của máy trạng thái hàng đầu
Lập kế hoạch chuyển động: Với lộ trình được lên kế hoạch và lớp hành vi xác định cách điều hướng nó, hệ thống lập kế hoạch chuyển động sẽ điều phối các chuyển động của ô tô. Điều này có nghĩa là phải đảm bảo xe di chuyển sao cho vừa an toàn vừa thoải mái cho người ngồi bên trong. Nó nghĩ về những thứ như tốc độ nó đi, chuyển làn đường và những gì xung quanh nó.
Điều khiển phương tiện: Bước cuối cùng là điều khiển phương tiện, thực hiện đường dẫn tham chiếu do hệ thống lập kế hoạch chuyển động tạo ra, đảm bảo ô tô đi theo quỹ đạo đã định một cách trơn tru và an toàn.
Bằng cách chia nhỏ việc ra quyết định thành những phần khác nhau, xe tự lái có thể lái tốt và an toàn ở những nơi phức tạp. Điều này đảm bảo hành khách sẽ có một chuyến đi suôn sẻ và thoải mái.
Mạng thần kinh tích chập
Mạng thần kinh tích chập (CNN) được sử dụng rộng rãi trong ô tô tự lái do khả năng mô hình hóa thông tin không gian, đặc biệt là hình ảnh. CNN vượt trội trong việc trích xuất các đặc điểm từ hình ảnh, khiến chúng trở nên hữu ích trong việc tìm ra nhiều thứ khác nhau.
Trong CNN, khi độ sâu của mạng tăng lên, các lớp khác nhau sẽ nắm bắt các mẫu khác nhau. Các lớp đầu phát hiện các đặc điểm đơn giản như các cạnh, trong khi các lớp sâu hơn nhận biết các đặc điểm phức tạp hơn, chẳng hạn như hình dạng vật thể (như lá trên cây hoặc lốp xe). Khả năng thích ứng này là lý do tại sao CNN là thuật toán trung tâm trong ô tô tự lái.
Thành phần cốt lõi của CNN là lớp tích chập, sử dụng nhân tích chập (ma trận bộ lọc) để xử lý các vùng cục bộ của hình ảnh đầu vào.
Ma trận bộ lọc được cập nhật trong quá trình huấn luyện để thu được các trọng số có ý nghĩa. Đặc tính cơ bản của CNN là chia sẻ trọng số, trong đó các tham số trọng lượng giống nhau được sử dụng để biểu diễn các phép biến đổi khác nhau, tiết kiệm không gian xử lý và cho phép biểu diễn tính năng đa dạng.
Đầu ra của lớp tích chập thường được chuyển qua hàm kích hoạt phi tuyến, như Sigmoid, Tánh hoặc ReLU. ReLU được ưa thích vì nó hội tụ nhanh hơn các loại khác. Ngoài ra, kết quả thường đi qua lớp tổng hợp tối đa. Điều này giữ các chi tiết quan trọng khỏi hình ảnh, như nền và họa tiết.
Ba đặc tính cơ bản của CNN khiến chúng trở nên linh hoạt và cơ bản trong ô tô tự lái:
- Trường tiếp nhận cục bộ
- Trọng lượng được chia sẻ
- Lấy mẫu không gian
Các thuộc tính này làm giảm việc trang bị quá mức và lưu trữ các biểu diễn cũng như tính năng quan trọng cần thiết cho việc phân loại, phân đoạn, bản địa hóa hình ảnh, v.v.
Dưới đây là hai mạng CNN được các công ty tiên phong về xe tự lái sử dụng:
- HydraNet của Tesla
- ChauffeurNet của Google Waymo
Tìm hiểu thêm về Mạng thần kinh chuyển đổi.
#1. HydraNet của Tesla
HydraNet là một kiến trúc động được giới thiệu bởi Ravi et al. vào năm 2018, chủ yếu được phát triển để phân khúc theo ngữ nghĩa trên ô tô tự lái. Mục tiêu chính của nó là cải thiện hiệu quả tính toán trong quá trình suy luận.
Khái niệm HydraNet liên quan đến việc có các mạng CNN khác nhau, được gọi là các nhánh, được giao cho các nhiệm vụ cụ thể. Mỗi nhánh nhận được nhiều đầu vào khác nhau và mạng có thể chọn lọc các nhánh sẽ chạy trong quá trình suy luận, cuối cùng tổng hợp các đầu ra từ các nhánh khác nhau để đưa ra quyết định cuối cùng.
Trong bối cảnh ô tô tự lái, đầu vào có thể đại diện cho các khía cạnh khác nhau của môi trường, chẳng hạn như các vật thể tĩnh (cây cối và lan can đường), đường và làn đường, đèn giao thông, v.v. Những đầu vào này được đào tạo trong các nhánh riêng biệt. Trong quá trình suy luận, cơ chế cổng quyết định nhánh nào sẽ được kích hoạt và bộ kết hợp thu thập đầu ra của chúng để đưa ra quyết định cuối cùng.
Phát hiện tốc độ, làn đường và chuyển động
Tesla đã điều chỉnh kiến trúc HydraNet, kết hợp xương sống chung để giải quyết các thách thức trong việc phân tách dữ liệu cho các nhiệm vụ riêng lẻ trong quá trình suy luận. Đường trục dùng chung, thường là các khối ResNet-50 được sửa đổi, cho phép mạng được huấn luyện trên dữ liệu của tất cả các đối tượng. Các phần đầu dành riêng cho nhiệm vụ dựa trên kiến trúc phân đoạn ngữ nghĩa, như U-Net, cho phép mô hình dự đoán kết quả đầu ra cụ thể cho từng nhiệm vụ.
HydraNet của Tesla nổi bật nhờ khả năng chiếu tầm nhìn từ mắt chim, tạo ra hình ảnh 3D về môi trường từ mọi góc độ. Chiều hướng nâng cao này hỗ trợ xe điều hướng tốt hơn. Điều đáng chú ý là Tesla đạt được điều này mà không cần sử dụng cảm biến LiDAR. Thay vào đó, nó chỉ dựa vào hai cảm biến: camera và radar. Hiệu quả của HydraNet của Tesla cho phép nó xử lý thông tin từ tám camera và tạo ra nhận thức về chiều sâu, thể hiện khả năng ấn tượng mà không cần thêm công nghệ LiDAR
#2. ChauffeurNet của Google Waymo
ChauffeurNet là mạng thần kinh dựa trên RNN được Google Waymo sử dụng để đào tạo xe tự lái bằng cách học mô phỏng. Mặc dù nó chủ yếu dựa vào RNN để tạo quỹ đạo lái xe, nhưng nó cũng kết hợp thành phần CNN được gọi là FeatureNet.
Mạng tính năng tích chập này trích xuất các biểu diễn tính năng theo ngữ cảnh được chia sẻ bởi các mạng khác và được sử dụng để trích xuất các tính năng từ hệ thống nhận thức.
Nguồn: Cổng nghiên cứu
Ý tưởng đằng sau ChauffeurNet là đào tạo xe tự lái bằng cách bắt chước các tài xế chuyên nghiệp bằng cách học mô phỏng. Để khắc phục hạn chế là không đủ dữ liệu đào tạo thực tế, các tác giả của bài báo “ChauffeurNet: Học lái xe bằng cách bắt chước những điều tốt nhất và tổng hợp những điều tồi tệ nhất” đã giới thiệu dữ liệu tổng hợp.
Dữ liệu tổng hợp này đưa ra nhiều sai lệch khác nhau, chẳng hạn như làm xáo trộn đường quỹ đạo, thêm chướng ngại vật và tạo ra những cảnh không tự nhiên. Huấn luyện ô tô bằng dữ liệu tổng hợp được cho là hiệu quả hơn so với việc chỉ sử dụng dữ liệu thực.
Trong ChauffeurNet, hệ thống nhận thức không phải là một phần của quy trình từ đầu đến cuối mà hoạt động như một hệ thống cấp trung. Điều này cho phép mạng có nhiều biến thể đầu vào khác nhau từ hệ thống nhận thức. Mạng quan sát sự thể hiện ở mức độ trung bình của khung cảnh từ các cảm biến và sử dụng đầu vào này cùng với dữ liệu tổng hợp, nó bắt chước hành vi lái xe chuyên nghiệp.
Bằng cách phân tích nhiệm vụ nhận thức và tạo ra cái nhìn toàn cảnh về môi trường ở cấp độ cao, ChauffeurNet tạo điều kiện cho việc học chuyển giao dễ dàng hơn, cho phép mạng đưa ra quyết định tốt hơn dựa trên cả dữ liệu thực và mô phỏng. Mạng tạo ra các quỹ đạo lái xe bằng cách dự đoán lặp đi lặp lại các điểm liên tiếp trên đường lái xe dựa trên các biểu diễn cấp trung. Cách tiếp cận này đã cho thấy nhiều hứa hẹn trong việc đào tạo xe tự lái hiệu quả hơn, mở ra con đường hướng tới các hệ thống lái tự động an toàn hơn và đáng tin cậy hơn.
#3. Quy trình quyết định Markov có thể quan sát được một phần được sử dụng cho xe tự lái
Quy trình quyết định Markov có thể quan sát được một phần (POMDP) là một khung toán học được sử dụng trong bối cảnh ô tô tự lái để đưa ra quyết định trong điều kiện không chắc chắn. Trong các tình huống thực tế, ô tô tự lái thường có thông tin hạn chế về môi trường do tiếng ồn cảm biến, tắc nghẽn hoặc hệ thống nhận thức không hoàn hảo. POMDP được thiết kế để xử lý khả năng quan sát một phần như vậy và đưa ra quyết định tối ưu bằng cách xem xét cả độ không đảm bảo và các quan sát có sẵn.
Trong POMDP, tác nhân ra quyết định hoạt động trong môi trường có các trạng thái có thể quan sát được một phần. Tác nhân thực hiện hành động và môi trường chuyển sang trạng thái mới theo xác suất. Tuy nhiên, tác nhân chỉ nhận được các quan sát một phần hoặc thông tin nhiễu về trạng thái thực sự của môi trường. Mục tiêu là tìm ra chính sách tối đa hóa phần thưởng tích lũy dự kiến theo thời gian trong khi xem xét tính không chắc chắn của môi trường và quan sát của tác nhân.
Nguồn: Cổng nghiên cứu
Trong bối cảnh ô tô tự lái, POMDP đặc biệt hữu ích cho các nhiệm vụ như lập kế hoạch chuyển động, dự đoán quỹ đạo và tương tác với những người tham gia giao thông khác. Xe tự lái có thể sử dụng POMDP để đưa ra quyết định về việc thay đổi làn đường, điều chỉnh tốc độ và tương tác với người đi bộ cũng như các phương tiện khác, có tính đến sự không chắc chắn của môi trường xung quanh.
POMDP có sáu thành phần và có thể được ký hiệu là POMDP
M:=(I,S,A,R,P,γ)
Ở đâu,
I: Quan sát
S: Tập hữu hạn các trạng thái
A: Tập hữu hạn các hành động
R: Chức năng thưởng
P: Hàm xác suất chuyển tiếp
γ: hệ số chiết khấu cho phần thưởng trong tương lai.
POMDP có thể gặp khó khăn về mặt tính toán do cần phải xem xét nhiều trạng thái và quan sát có thể có. Tuy nhiên, các thuật toán tiên tiến, chẳng hạn như quy hoạch không gian niềm tin và phương pháp Monte Carlo, thường được sử dụng để ước tính chính sách tối ưu một cách hiệu quả và cho phép ra quyết định theo thời gian thực trên ô tô tự lái.
Bằng cách kết hợp POMDP vào các thuật toán ra quyết định, ô tô tự lái có thể điều hướng các môi trường phức tạp và không chắc chắn một cách hiệu quả và an toàn hơn, xem xét độ không chắc chắn trong chỉ số cảm biến và đưa ra quyết định sáng suốt để đạt được mục tiêu đã định.
Ô tô tự lái, hoạt động như một tác nhân, học bằng cách tương tác với môi trường bằng phương pháp học tăng cường (RL), một loại học máy. Trạng thái, hành động và phần thưởng là ba biến số quan trọng cốt lõi của Học tăng cường sâu (DRL).
Trạng thái: Mô tả tình hình hiện tại của ô tô tự lái tại một thời điểm nhất định, chẳng hạn như vị trí của nó trên đường.
Hành động: Thể hiện tất cả các chuyển động có thể xảy ra mà ô tô có thể thực hiện, bao gồm các quyết định như chuyển làn đường hoặc điều chỉnh tốc độ.
Phần thưởng: Cung cấp phản hồi cho ô tô bất cứ khi nào nó thực hiện một hành động cụ thể. Phần thưởng có thể tích cực hoặc tiêu cực và mục tiêu của DRL là tối đa hóa phần thưởng tích lũy.
Không giống như học có giám sát, trong đó thuật toán được đưa ra các hành động chính xác một cách rõ ràng, DRL học bằng cách khám phá môi trường và nhận phần thưởng dựa trên hành động của nó. Mạng nơ-ron của ô tô tự lái được đào tạo dựa trên dữ liệu nhận thức, bao gồm các tính năng được trích xuất bởi mạng nơ-ron tích chập (CNN).
Các thuật toán DRL sau đó được huấn luyện dựa trên các biểu diễn này, là các phép biến đổi chiều thấp hơn của đầu vào, dẫn đến việc ra quyết định hiệu quả hơn trong quá trình suy luận.
Việc huấn luyện xe tự lái trong các tình huống thực tế là nguy hiểm và không thực tế. Thay vào đó, họ được đào tạo về Trình mô phỏng, nơi không có rủi ro đối với sự an toàn của con người.
Giả lập
Một số trình mô phỏng nguồn mở là:
Bằng cách kết hợp dữ liệu nhận thức với học tập tăng cường, xe tự lái có thể học cách điều hướng trong các môi trường phức tạp, đưa ra quyết định an toàn và tối ưu, đồng thời trở nên thành thạo hơn trong việc xử lý các tình huống lái xe trong thế giới thực.
Câu hỏi thường gặp
Xe tự hành là gì?
Xe tự hành, thường được gọi là xe tự lái, là những chiếc ô tô được trang bị cảm biến tiên tiến và trí tuệ nhân tạo có thể tự điều hướng và lái xe. Những phương tiện này đánh giá môi trường và đưa ra phán đoán lái xe bằng cách sử dụng camera, LiDAR, RADAR và các thuật toán phức tạp.
Xe tự hành có an toàn không?
Trong quá trình phát triển ô tô tự lái, an toàn là ưu tiên hàng đầu. Để đảm bảo tuân thủ các quy định an toàn cao, những phương tiện này phải trải qua quá trình thử nghiệm và mô phỏng kỹ lưỡng. Mặc dù đã xảy ra sự cố trong quá trình thử nghiệm nhưng mục tiêu cuối cùng là làm cho ô tô tự lái an toàn hơn ô tô do con người điều khiển.
Xe tự hành có thể được sử dụng trong bất kỳ thời tiết nào?
Thời tiết khắc nghiệt, bao gồm mưa lớn hoặc tuyết, có thể gây ra vấn đề cho ô tô tự lái. Thời tiết không thuận lợi có thể làm giảm độ chính xác của cảm biến và làm giảm khả năng lái xe. Các kỹ sư không ngừng cố gắng làm cho công nghệ hoạt động tốt hơn trong điều kiện thời tiết bất lợi.
Xe tự hành – chúng có được phép không?
Tính hợp pháp của xe tự hành thay đổi tùy theo quốc gia và địa điểm. Để hỗ trợ các phương tiện tự hành, nhiều khu vực pháp lý đang sửa đổi luật và quy định của họ. Thử nghiệm xe tự lái và triển khai hạn chế đã được cho phép ở một số khu vực.
Xe tự hành có cần sự can thiệp của con người không?
Hầu hết những chiếc xe tự lái hiện có đều ở mức tự động hóa cấp 2 hoặc cấp 3, đôi khi chúng có thể cần sự trợ giúp của con người. Tuy nhiên, ngành này cố gắng đạt đến mức độ tự động hóa cao hơn, chẳng hạn như cấp độ 4 hoặc cấp độ 5, nơi sự can thiệp của con người trở nên tối thiểu hoặc không cần thiết.
Phần kết luận
Tóm lại, ô tô tự lái có khả năng biến đổi ngành công nghiệp ô tô bằng cách nâng cao hiệu quả và an toàn đường bộ. Chúng tôi đã xem xét tất cả các thành phần thiết yếu hỗ trợ những chiếc xe tự hành này, bao gồm LiDAR, RADAR, máy ảnh và các thuật toán nâng cao.
Mặc dù tiến độ đã đầy hứa hẹn nhưng vẫn còn những thách thức quan trọng cần giải quyết. Hiện tại, ô tô tự lái đang ở cấp độ tiến bộ 2 trên cấp độ 5, cần có sự can thiệp của con người trong một số tình huống nhất định. Tuy nhiên, thông qua sự cống hiến và đổi mới liên tục, chúng tôi đang tiến gần hơn đến việc đạt được quyền tự chủ hoàn toàn.
Bài học chính
Thuật toán nâng cao: Việc tối ưu hóa hơn nữa các thuật toán là rất quan trọng để nâng cao nhận thức về đường, đặc biệt là trong các điều kiện đầy thách thức khi có thể thiếu vạch kẻ đường và biển báo.
Tinh chỉnh phương thức cảm biến: Cải thiện tính chính xác và hiệu quả của các phương thức cảm biến để lập bản đồ và định vị sẽ là công cụ giúp đạt được mức độ tự chủ cao hơn.
Truyền thông giữa các phương tiện: Việc tạo ra một hệ sinh thái đường thông minh và liên kết sẽ có thể thực hiện được bằng cách theo đuổi phương thức liên lạc giữa các phương tiện.
Tương tác giữa người và máy: Việc khuyến khích sự chấp nhận của công chúng đối với các công nghệ tự lái sẽ yêu cầu kiểm tra và giải quyết các vấn đề liên quan đến tương tác giữa người và máy.
Triển vọng trong tương lai: Bất chấp những khó khăn, những thành tựu đạt được cho đến nay rất đáng chú ý và với sự hợp tác và nghiên cứu không ngừng, xe tự lái mang lại tiềm năng cung cấp một môi trường giao thông an toàn và hiệu quả hơn cho mọi người.
Tất cả chúng ta đều đang trên cùng một hành trình hướng tới những chiếc xe tự lái hoàn toàn tự động. Khi giải quyết các thách thức và thúc đẩy đổi mới, chúng ta đang tiến gần hơn đến thời điểm các phương tiện quản lý đường đi một cách trơn tru, cải thiện độ an toàn, môi trường và sự thuận tiện cho mọi người.
Bây giờ bạn có thể tìm hiểu về điện toán không gian và ứng dụng của nó trong việc phát triển ô tô tự lái.