您现在的位置是:Giải trí >>正文
Đạt giải nhất cấp quốc gia nhờ cải tiến mô hình của chuyên gia nước ngoài
Giải trí11人已围观
简介Cuộc thi Khoa học kỹ thuật cấp quốc gia học sinh trung học năm học 2022 – 2023 vừa diễn ra. Cu...
Cuộc thi Khoa học kỹ thuật cấp quốc gia học sinh trung học năm học 2022 – 2023 vừa diễn ra. Cuộc thi năm nay thu hút sự tham gia của 143 dự án của 272 học sinh,Đạtgiảinhấtcấpquốcgianhờcảitiếnmôhìnhcủachuyêngianướcngoàbóng đá tốc độ cao trong đó, có 48 học sinh cấp THCS và 224 học sinh cấp THPT.
Đến với cuộc thi lần này, đề tài “Cải tiến mô hình khuếch tán để tạo sinh hình ảnh” của 2 học sinh Đặng Bảo Khoa (lớp 12 chuyên Tin) và em Huỳnh Hà Giang (lớp 11 chuyên Tin) của trường THPT Chuyên Nguyễn Bỉnh Khiêm (TP Tam Kỳ, tỉnh Quảng Nam) vừa giành được giải Nhất.
Nhập dữ liệu, xuất hiện hình ảnh
Phân tích rõ hơn về đề tài, Khoa cho biết, trong năm 2022, các nhà nghiên cứu ở ĐH LMU Munich (Đức), đã cho mở mã nguồn của mô hình khuếch tán ổn định (Stable Diffusion) sau khi công bố chi tiết nghiên cứu trong hội nghị.
Mô hình này nhận nhập dữ liệu là một đoạn mô tả bằng ngôn ngữ tự nhiên, sau đó cho ra một hình ảnh thể hiện trực quan những thông tin và dữ kiện trong đoạn mô tả đó.

“Trong khi làm việc cho các câu lạc bộ ngoại khóa của trường, chúng em được giao những nhiệm vụ như thiết kế logo, tranh ảnh hoặc poster.
Nguồn tư liệu hình ảnh chúng em tìm được trên Google quá ít, thậm chí còn không có hình ảnh chính xác với nhu cầu của chúng em, vì vậy chúng em đã tìm đến mô hình Stable Diffusion”, Khoa chia sẻ.
Giang tiếp lời, tuy nhiên, nhận thấy đối với những văn bản đầu vào phức tạp, có nhiều ngữ nghĩa (gồm nhiều mệnh đề mô tả các sự vật có nhiều thuộc tính về màu sắc, kích thước, phong cách, hình dáng, số lượng), hình ảnh đầu ra của mô hình này không nhất quán với các mô tả ở dữ liệu đầu vào, nhóm đã lên ý tưởng nâng cấp mô hình.

Hà Giang giải thích: “Đối với những văn bản đầu vào phức tạp, có nhiều yếu tố ngữ nghĩa ở nhiều bối cảnh khác nhau, mô hình sau khi cải tiến của chúng em có thể cho ra hình ảnh chuẩn xác với các mô tả ở dữ liệu đầu vào”.
Mô hình này sẽ nhận dữ liệu đầu vào là một đoạn văn bản mô tả, sau đó sẽ tạo ra một hình ảnh tương ứng cho người dùng qua giao diện web.

Ví dụ nhập một đoạn mô tả: “A dolphin in Ha Long bay with the blue sky" (nghĩa là một con cá heo ở vịnh Hạ Long cùng bầu trời màu xanh), mã nguồn gốc của các nhà nghiên cứu ở đại học LMU Munich sẽ cho ra hình ảnh khó nhìn, chưa thực tế. Những hình ảnh sau khi được nâng cấp sẽ rõ ràng và chuẩn chỉ hơn.
“Trong quá trình làm phần mềm, hạ tầng là một điều rất khó khăn vì mô hình yêu cầu một lượng lớn bộ nhớ để xử lý”, Giang nêu lên khó khăn.

Phát triển những kết quả tinh xảo
Nói đến các dự định tiếp theo, Khoa cho rằng, mô hình khuếch tán (Diffusion) đạt được bước tiến mang tính cách mạng trong bài toán tổng hợp hình ảnh. Tuy nhiên, việc tạo sinh ra một kết quả tinh xảo vẫn là một thách thức rất lớn.
Các mô hình khuếch tán không thể học được cách "vẽ" hoàn mỹ một chi tiết nhỏ, như năm ngón tay người. Để khắc phục được nhược điểm này, cần có những nghiên cứu chuyên sâu hơn, đồng thời bổ sung thêm nhiều dữ liệu rõ ràng và cụ thể.

“Chúng em đang thử nghiệm các nghiên cứu mới như DreamBooth, hỗ trợ học chuyển tiếp các mô hình tiền huấn luyện chỉ với số lượng rất ít các vật mẫu mới (few-shot learning), với mục tiêu tạo ra được kết quả chất lượng cao. Cùng với đó, sẽ cố gắng nâng cấp mô hình chạy bằng tiếng Việt”, nam sinh định hướng.
Thầy Phan Văn Lĩnh - Phó Hiệu trưởng Trường THPT Chuyên Nguyễn Bỉnh Khiêm (cũng là giáo viên cố vấn), cho biết lần đầu nghe các em trình bày về ý tưởng đã rất ấn tượng và muốn hỗ trợ các em thực hiện đến cùng bài toán thiết thực này.

“Ban đầu, Khoa và Giang đề xuất ý tưởng cải tiến công cụ tạo sinh hình ảnh, chỉ bởi vì các em nghĩ rằng nó có thể giúp ích cho công việc thiết kế đồ họa ở câu lạc bộ ngoại khoá trong trường.
Tuy nhiên, tôi đã nhận ra ngay tiềm năng vô hạn của đề tài trong rất nhiều lĩnh vực: giáo dục, truyền thông, điều tra phá án, thiết kế nội thất. Bất cứ công việc gì cần phải sử dụng tranh ảnh, ta có thể ứng dụng công cụ này để tự động hoá hoàn toàn, giải phóng sức lao động của con người”, thầy Lĩnh giải thích.
Ví dụ, chỉ một tác dụng nhỏ như tạo tranh minh hoạ cho bài học trên lớp hoặc hỗ trợ các đồng chí điều tra viên phác thảo chân dung tội phạm qua lời mô tả bằng ngôn ngữ tự nhiên, cũng có thể phát huy được tác dụng của công cụ tạo sinh ảnh để tạo ra một tác động rất lớn đến xã hội quanh ta.
Thầy đánh giá lợi thế của phần mềm này là có tiềm năng tự động hóa rất lớn, giúp giải phóng sức lao động của con người và giảm tối đa kinh phí.

Tags:
相关文章
Nhận định, soi kèo Yadanarbon FC vs Dagon FC, 16h30 ngày 18/2: 3 điểm xa nhà
Giải tríHồng Quân - 17/02/2025 20:09 Nhận định bóng đ ...
【Giải trí】
阅读更多6 lý do “kết liễu” số phận đĩa CD, DVD
Giải trí Ảnh: Internet1. Những tiếng kêu vo vo
Ổ CD hay DVD có những thành phần cơ học để quay chiếc đĩa ở tốc độ cao trong khi dữ liệu được đọc bằng 1 mắt thần (hay tia laser). Kể cả khi bạn không nghe thấy, tiếng kêu vo vo của ổ đĩa cũng tạo ra tiếng ồn ở xung quanh.
2. Dễ bám bụi
Những thành phần cơ học khi quay ở tốc độ nhanh, cuối cùng sẽ bị hỏng. Ổ đĩa CD rất dễ bám bụi và có thể ảnh hưởng tới khả năng đọc dữ liệu của mắt laser. Quay trở lại thập kỷ trước, ổ đĩa quang là nguyên nhân đầu tiên khiến chúng ta mất tiền sửa và thay thế chiếc desktop, laptop, thiết bị chơi game như Nintendo Wii hay Xbox 360, hoặc chính những ổ Blu-Ray và DVD trước kia.
3. Tiêu hao nhiều năng lượng
Sử dụng ổ CD hay DVD sẽ tiêu hao rất nhiều năng lượng pin trên những thiết bị cầm tay. Máy tính để bàn hay laptop cũng không phải ngoại lệ.
">...
【Giải trí】
阅读更多FPT bị phạt vì cung cấp game không phép
Giải trí Game chip online của FPT Online bị xử phạtTheo thông tin từ Sở TT&TT TP.HCM, cơ quan này vừa đề nghị UBND TPHCM tiến hành xử phạt 3 công ty cung cấp game online không phép với mức xử phạt 40 triệu đồng với mỗi công ty. Trong đó, Công ty cổ phần trực tuyến FPT Online bị phạt vì cung cấp trò chơi trực tuyến Chip online trên trang thông tin điện tử http://chip.gate.vn , bao gồm các phiên bản đánh bài Tiến lên như Tiến lên miền nam, Tiến lên miền Bắc… khi chưa được cơ quan quản lý cấp phép.
">Bị phạt nhưng gameken.us của công ty Đế Vương vẫn hoạt động bình thường - Ảnh chụp màn hình vào lúc 18h50 ngày 19/06/2011 ...
【Giải trí】
阅读更多
热门文章
- Nhận định, soi kèo Bali United vs Malut United, 19h00 ngày 17/2: Tin vào cửa trên
- Clip lắc chân có thể buộc dây giầy
- Máy in màu A4 nhanh nhất thế giới
- Chiêu lừa đảo mới: Giả vờ nhắn tin nhầm để kiếm tiền
- Nhận định, soi kèo Lens vs Strasbourg, 23h15 ngày 16/2: Khách không dễ chơi
- Smartphone Sony Ericsson mới khoe dáng 'siêu đẹp'
最新文章
-
Nhận định, soi kèo Vitoria Guimaraes vs Braga, 03h30 ngày 17/2: Tiếp đà thăng hoa
-
Không chỉ cung cấp một số hình ảnh, giới công nghệ còn được xem một đoạn video giới thiệu các phần mềm và ứng dụng cài đặt trên Droid Bionic ngay trong Motorola Web-store. Theo video này, Droid Bionic rất có khả năng đã chuyển từ giao diện Moto Blur sang Android 2.3.Gingerbread.
Một số thông số kĩ thuật đưa ra trên website nhưng chưa đầy đủ:
- Bộ vi xử lí lõi kép tốc độ 1GHz và kết nối 4G
- Đa tác vụ, màn hình lớn
" alt="DROID Bionic xuất hiện trên cửa hàng Motorola">DROID Bionic xuất hiện trên cửa hàng Motorola
-
Hình thành cách đây hơn 5 năm, chợ đêm phố cổ mở cửa trong các tối từ thứ 6 đến Chủ nhật, có chiều dài hơn 1 km với nhiều “shop lưu động" kéo dài bắt đầu từ Hàng Đào, Hàng Ngang, Hàng Đường, chợ Đồng Xuân đến Hàng Giấy. Từ các mặt hàng thực phẩm cho đến đồ dùng sinh hoạt, từ đồ trang sức, trang trí cho đến đồ công nghệ… tất cả đều quy tụ tại đây.
Đặc biệt, hiện nay, các mặt hàng như vỏ, bao da, đồ trang trí… cho điện thoại mọc lên như nấm. Các “shop di động” xuất hiện rải rác trong chợ và “bùng” lên ở khúc cuối, ngay trước mặt Chợ Đồng Xuân.
Nhiều mẫu mã, màu sắc và kiểu dáng cho khách hàng lựa chọn. Hầu hết các sản phẩm này có xuất xứ từ Trung Quốc. Từ những chiếc vỏ bọc bằng nhựa cho hàng cao cấp của iPhone, Nokia, Sony Ericsson, Samsung…
" alt="Đi chợ đồ trang trí cho 'dế'">Đi chợ đồ trang trí cho 'dế'
-
Hôm nay, Pentax giới thiệu phiên bản đặc biệt của mẫu máy ảnh định dạng medium-format 645D nhằm kỷ niệm cho sự kiện đạt giải chiếc camera của năm Camera Grand Prix 2011. Pentax 645D Limited Edition có màu đỏ sơn mài nhưng vẫn giữ nguyên các thông số kỹ thuật bên trong.
Hộp đựng bằng gỗ cây Hông. Ảnh: Pocket-lint. Pentax 645D sở hữu cảm biến CCD cỡ lớn 44 x 33 mm với độ phân giải 40 triệu điểm ảnh, bộ xử lý hình ảnh PRIME II với khả năng xử lý luồng dữ liệu dung lượng lớn và sử dụng giải thuật mới được tối ưu hóa riêng cho định dạng medium format. Máy có màn hình 3 inch 921.000 điểm và tương thích với tất cả các ống kính chuyên cho hệ 645.
" alt="Pentax ra mắt 645D bản đặc biệt màu đỏ sơn mài">Pentax ra mắt 645D bản đặc biệt màu đỏ sơn mài
-
Nhận định, soi kèo Mallorca vs Las Palmas, 0h30 ngày 17/2: Giành lại ưu thế
-
" alt="Clip cô gái chơi vật tay bị gãy tay"> Clip cô gái chơi vật tay bị gãy tay