Thuật toán vẽ đường nhanh


9

Nhiệm vụ là tìm cách vẽ một đường nằm ngang trong một mảng các số nguyên 16 bit.

Chúng tôi giả sử một mảng 256x192 pixel với 16 pixel mỗi từ. Một dòng là một chuỗi các bit set (1) liền kề. Các dòng có thể bắt đầu ở giữa bất kỳ từ nào, chồng lên bất kỳ từ nào khác và kết thúc bằng bất kỳ từ nào; họ cũng có thể bắt đầu và kết thúc trong cùng một từ. Họ có thể không gói vào dòng tiếp theo. Gợi ý: các từ ở giữa rất dễ dàng - chỉ cần viết 0xffff, nhưng các cạnh sẽ khó khăn, vì sẽ xử lý trường hợp cho bắt đầu và kết thúc trong cùng một từ. Hàm / thủ tục / thường trình phải lấy tọa độ x0 và x1 chỉ ra điểm bắt đầu và điểm dừng ngang, cũng như tọa độ ay.

Tôi loại trừ bản thân mình khỏi điều này bởi vì tôi đã tự mình thiết kế một thuật toán gần như giống hệt nhau cho một bộ xử lý nhúng nhưng tôi tò mò không biết người khác sẽ làm thế nào về nó. Điểm thưởng cho việc sử dụng các hoạt động tương đối nhanh (ví dụ: hoạt động nhân 64 bit hoặc dấu phẩy động sẽ không nhanh trên máy nhúng nhưng sẽ có một sự thay đổi bit đơn giản.)


2
Codegolf là về mã ngắn, không phải mã nhanh hay tối ưu hóa tốc độ.
hallvabo

@hallvabo Giải pháp của tôi khá ngắn, khoảng 5 dòng khi giới hạn kiểm tra và các tính năng bổ sung (như bật các pixel thay vì đặt chúng.) bị xóa.
Thomas O

9
@hallvabo, trang này không chỉ có codegolf. Cũng là về tối ưu hóa tốc độ, nhưng không phải tất cả các loại tối ưu hóa: không phải chi tiết phần cứng, mà là độ phức tạp của thuật toán.
Nakilon

@Nakilon: Tôi không đồng ý. Vậy thì tại sao trang web này có tên Code Golf? Có hàng ngàn trang web khác để thảo luận về độ phức tạp thuật toán và tối ưu hóa tốc độ.
hallvabo

5
@hallvabo: Từ Câu hỏi thường gặp - "Code Golf - Stack Exchange dành cho những người chơi golf mã và cho những người quan tâm đến việc chơi golf mã (từ người mới bắt đầu đến chuyên gia) và các câu đố lập trình." Tôi coi đây là một câu đố lập trình.
Thomas O

Câu trả lời:


3

Mã này giả định rằng cả x0 và x1 là các điểm cuối bao gồm và các từ đó là endian nhỏ (nghĩa là (0,0) pixel có thể được đặt với array[0][0]|=1).

int line(word *array, int x0, int x1, int y) {
 word *line = array + (y << 4);
 word *start = line + (x0 >> 4);
 word *end = line + (x1 >> 4);
 word start_mask = (word)-1 << (x0 & 15);
 word end_mask = (unsigned word)-1 >> (15 - (x1 & 15));
 if (start == end) {
  *start |= start_mask & end_mask;
 } else {
  *start |= start_mask;
  *end |= end_mask;
  for (word *p = start + 1; p < end; p++) *p = (word)-1;
 }
}

1
Nó nhanh như thế nào
người dùng không xác định

1

Con trăn

Thủ thuật chính ở đây là sử dụng bảng tra cứu để lưu trữ bitmasks của các pixel. Điều này tiết kiệm một vài hoạt động. Một bảng 1kB không lớn ngay cả đối với một nền tảng nhúng ngày nay

Nếu không gian thực sự chật hẹp, với giá của một vài & 0xf, bảng tra cứu có thể giảm xuống chỉ còn 64B

Mã này bằng Python, nhưng sẽ đơn giản để chuyển sang bất kỳ ngôn ngữ nào hỗ trợ các hoạt động bit.

Nếu sử dụng C, bạn có thể xem xét tháo vòng lặp bằng cách sử dụng switchtừ thiết bị của Duff . Vì dòng này rộng tối đa 16 từ, tôi sẽ mở rộng switchđến 14 dòng và phân phối whilehoàn toàn.

T=[65535, 32767, 16383, 8191, 4095, 2047, 1023, 511,
  255, 127, 63, 31, 15, 7, 3, 1]*16
U=[32768, 49152, 57344, 61440, 63488, 64512, 65024, 65280,
  65408, 65472, 65504, 65520, 65528, 65532, 65534, 65535]*16

def drawline(x1,x2,y):
  y_=y<<4
  x1_=y_+(x1>>4)
  x2_=y_+(x2>>4)
  if x1_==x2_:
    buf[x1_]|=T[x1]&U[x2]
    return  
  buf[x1_]|=T[x1]
  buf[x2_]|=U[x2]    
  x1_+=+1
  while x1_<x2_:
    buf[x1_] = 0xffff
    x1_+=1


#### testing code ####

def clear():
  global buf
  buf=[0]*192*16

def render():
  for y in range(192):
    print "".join(bin(buf[(y<<4)+x])[2:].zfill(16) for x in range(16))


clear()
for y in range(0,192):
  drawline(y/2,y,y)
for x in range(10,200,6):
  drawline(x,x+2,0)
  drawline(x+3,x+5,1)
for y in range(-49,50):
  drawline(200-int((2500-y*y)**.5), 200+int((2500-y*y)**.5), y+60)
render()

1

Đây là phiên bản C của câu trả lời Python của tôi bằng cách sử dụng câu lệnh switch thay vì vòng lặp while và giảm chỉ mục bằng cách tăng một con trỏ thay vì chỉ mục mảng

Kích thước của bảng tra cứu có thể được giảm đáng kể bằng cách sử dụng T [x1 & 0xf] và U [x2 & 0xf] cho một vài hướng dẫn bổ sung

#include <stdio.h>
#include <math.h>

unsigned short T[] = {0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
           0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
           0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001};

unsigned short U[] = {0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
           0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
           0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff};

unsigned short buf[192*16];

void clear(){
  int i;
  for (i=0; i<192*16; i++) buf[i]==0;
}

void render(){
  int x,y;
  for (y=0; y<192; y++){
    for (x=0; x<256; x++) printf("%d", (buf[(y<<4)+(x>>4)]>>(15-(x&15)))&1);
    printf("\n");
  }
}

void drawline(int x1, int x2, int y){
  int y_ = y<<4;
  int x1_ = y_+(x1>>4);
  int x2_ = y_+(x2>>4);
  unsigned short *p = buf+x1_;

  if (x1_==x2_){
    *p|=T[x1]&U[x2];
    return;
    }

  *p++|=T[x1];
  switch (x2_-x1_){
  case 14: *p++ = 0xffff;
  case 13: *p++ = 0xffff;
  case 12: *p++ = 0xffff;
  case 11: *p++ = 0xffff;
  case 10: *p++ = 0xffff;
  case 9: *p++ = 0xffff;
  case 8: *p++ = 0xffff;
  case 7: *p++ = 0xffff;
  case 6: *p++ = 0xffff;
  case 5: *p++ = 0xffff;
  case 4: *p++ = 0xffff;
  case 3: *p++ = 0xffff;
  case 2: *p++ = 0xffff;
  case 1: *p++ = U[x2];
  }   
}


int main(){
  int x,y;
  clear();

  for (y=0; y<192; y++){
    drawline(y/2,y,y); 
  }

  for (x=10; x<200; x+=6){
    drawline(x,x+2,0);
    drawline(x+3,x+5,1);
  }

  for (y=-49; y<50; y++){
    x = sqrt(2500-y*y);
    drawline(200-x, 200+x, y+60);
  }
  render();
  return 0;
  }

Nó nhanh như thế nào
người dùng không xác định

@user không rõ, một đoạn dây dài bao nhiêu? Tôi nghĩ rằng nó nên nhanh hơn câu trả lời được chấp nhận vì nó sử dụng bảng tra cứu để giảm bớt lượng công việc một chút. Tại sao bạn không thử chúng và cho chúng tôi biết những gì bạn tìm thấy?
gnibbler

1

Scala, 7s / 1M dòng 4.1s / 1M dòng

// declaration and initialisation of an empty field: 
val field = Array.ofDim[Short] (192, 16) 

thực hiện đầu tiên:

// util-method: set a single Bit:
def setBit (x: Int, y: Int) = 
 field (y)(x/16) = (field (y)(x/16) | (1 << (15 - (x % 16)))).toShort 
def line (x0: Int, x1: Int, y: Int) = 
 (x0 to x1) foreach (setBit (_ , y))

Sau khi loại bỏ cuộc gọi phương thức bên trong và thay thế for- bằng vòng lặp while, trên Lõi đơn 2Ghz của tôi bằng Scala 2.8, nó sẽ loại bỏ 1 Mio. Các dòng trong 4,1 giây. thay vì 7s ban đầu.

 def line (x0: Int, x1: Int, y: Int) = {
  var x = x0
  while (x < x1) { 
   field (y)(x/16) = (field (y)(x/16) | (1 << (15 - (x % 16)))).toShort
   x += 1
  }
 }

Mã kiểm tra và lời mời:

// sample invocation:
line (12, 39, 3) 
// verification 
def shortprint (s: Short) = s.toBinaryString.length match {     
 case 16 => s.toBinaryString                     
 case 32 => s.toBinaryString.substring (16)              
 case x => ("0000000000000000".substring (x) + s.toBinaryString)}

field (3).take (5).foreach (s=> println (shortprint (s)))      
// result:
0000000000001111
1111111111111111
1111111100000000
0000000000000000
0000000000000000

Kiểm tra năng suất:

 val r = util.Random 

 def testrow () {
  val a = r.nextInt (256)
  val b = r.nextInt (256)
  if (a < b)
   line (a, b, r.nextInt (192)) else
    line (b, a, r.nextInt (192)) 
 }

 def test (count: Int): Unit = {
  for (n <- (0 to count))
   testrow ()
 }

 // 1 mio tests
 test (1000*1000) 

Đã thử nghiệm với thời gian công cụ unix, so sánh thời gian người dùng, bao gồm thời gian khởi động, mã được biên dịch, không có giai đoạn khởi động JVM.

Việc tăng số lượng dòng cho thấy, cứ mỗi triệu mới, nó cần thêm 3,3 giây.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.