RetroSearch Browse

((__vector_size__(16), __aligned__(16)));

20typedef long long

__m128i

((__vector_size__(16), __aligned__(16)));

22typedef double

__m128d_u

((__vector_size__(16), __aligned__(1)));

23typedef long long

__m128i_u

28typedef long long

__v2di

((__vector_size__(16)));

33typedef unsigned long long

__v2du

((__vector_size__(16)));

34typedef unsigned short

__v8hu

((__vector_size__(16)));

35typedef unsigned char

__v16qu

((__vector_size__(16)));

39typedef signed char

__v16qs

((__vector_size__(16)));

47typedef

__bf16 __v8bf

((__vector_size__(16), __aligned__(16)));

48typedef

__bf16 __m128bh

((__vector_size__(16), __aligned__(16)));

52#if defined(__EVEX512__) && !defined(__AVX10_1_512__) 53#define __DEFAULT_FN_ATTRS \ 54 __attribute__((__always_inline__, __nodebug__, \ 55 __target__("sse2,no-evex512"

), __min_vector_width__(128)))

57#define __DEFAULT_FN_ATTRS \ 58 __attribute__((__always_inline__, __nodebug__, __target__("sse2"

), \

59

__min_vector_width__(128)))

62#if defined(__cplusplus) && (__cplusplus >= 201103L) 63#define __DEFAULT_FN_ATTRS_CONSTEXPR __DEFAULT_FN_ATTRS constexpr 65#define __DEFAULT_FN_ATTRS_CONSTEXPR __DEFAULT_FN_ATTRS 69 (__m64) __builtin_shufflevector((__v2di)(x), __extension__(__v2di){}, 0) 70#define __anyext128(x) \ 71 (__m128i) __builtin_shufflevector((__v2si)(x), __extension__(__v2si){}, 0, \ 109 return

(__m128d)((__v2df)

+ (__v2df)

);

149 return

(__m128d)((__v2df)

- (__v2df)

);

188 return

(__m128d)((__v2df)

* (__v2df)

);

229 return

(__m128d)((__v2df)

/ (__v2df)

);

253

__m128d

= __builtin_ia32_sqrtsd((__v2df)

);

254 return

__extension__(__m128d){

[0],

[1]};

269 return

__builtin_ia32_sqrtpd((__v2df)

);

294 return

__builtin_ia32_minsd((__v2df)

, (__v2df)

);

315 return

__builtin_ia32_minpd((__v2df)

, (__v2df)

);

340 return

__builtin_ia32_maxsd((__v2df)

, (__v2df)

);

361 return

__builtin_ia32_maxpd((__v2df)

, (__v2df)

);

378 return

(__m128d)((__v2du)

& (__v2du)

);

398 return

(__m128d)(~(__v2du)

& (__v2du)

);

415 return

(__m128d)((__v2du)

| (__v2du)

);

432 return

(__m128d)((__v2du)

^ (__v2du)

);

452 return

(__m128d)__builtin_ia32_cmpeqpd((__v2df)

, (__v2df)

);

473 return

(__m128d)__builtin_ia32_cmpltpd((__v2df)

, (__v2df)

);

494 return

(__m128d)__builtin_ia32_cmplepd((__v2df)

, (__v2df)

);

515 return

(__m128d)__builtin_ia32_cmpltpd((__v2df)

, (__v2df)

);

536 return

(__m128d)__builtin_ia32_cmplepd((__v2df)

, (__v2df)

);

558 return

(__m128d)__builtin_ia32_cmpordpd((__v2df)

, (__v2df)

);

581 return

(__m128d)__builtin_ia32_cmpunordpd((__v2df)

, (__v2df)

);

602 return

(__m128d)__builtin_ia32_cmpneqpd((__v2df)

, (__v2df)

);

623 return

(__m128d)__builtin_ia32_cmpnltpd((__v2df)

, (__v2df)

);

644 return

(__m128d)__builtin_ia32_cmpnlepd((__v2df)

, (__v2df)

);

665 return

(__m128d)__builtin_ia32_cmpnltpd((__v2df)

, (__v2df)

);

686 return

(__m128d)__builtin_ia32_cmpnlepd((__v2df)

, (__v2df)

);

709 return

(__m128d)__builtin_ia32_cmpeqsd((__v2df)

, (__v2df)

);

734 return

(__m128d)__builtin_ia32_cmpltsd((__v2df)

, (__v2df)

);

759 return

(__m128d)__builtin_ia32_cmplesd((__v2df)

, (__v2df)

);

784

__m128d

= __builtin_ia32_cmpltsd((__v2df)

, (__v2df)

);

785 return

__extension__(__m128d){

[0],

[1]};

810

__m128d

= __builtin_ia32_cmplesd((__v2df)

, (__v2df)

);

811 return

__extension__(__m128d){

[0],

[1]};

837 return

(__m128d)__builtin_ia32_cmpordsd((__v2df)

, (__v2df)

);

864 return

(__m128d)__builtin_ia32_cmpunordsd((__v2df)

, (__v2df)

);

889 return

(__m128d)__builtin_ia32_cmpneqsd((__v2df)

, (__v2df)

);

914 return

(__m128d)__builtin_ia32_cmpnltsd((__v2df)

, (__v2df)

);

939 return

(__m128d)__builtin_ia32_cmpnlesd((__v2df)

, (__v2df)

);

964

__m128d

= __builtin_ia32_cmpnltsd((__v2df)

, (__v2df)

);

965 return

__extension__(__m128d){

[0],

[1]};

990

__m128d

= __builtin_ia32_cmpnlesd((__v2df)

, (__v2df)

);

991 return

__extension__(__m128d){

[0],

[1]};

1013 return

__builtin_ia32_comisdeq((__v2df)

, (__v2df)

);

1037 return

__builtin_ia32_comisdlt((__v2df)

, (__v2df)

);

1061 return

__builtin_ia32_comisdle((__v2df)

, (__v2df)

);

1085 return

__builtin_ia32_comisdgt((__v2df)

, (__v2df)

);

1109 return

__builtin_ia32_comisdge((__v2df)

, (__v2df)

);

1133 return

__builtin_ia32_comisdneq((__v2df)

, (__v2df)

);

1155 return

__builtin_ia32_ucomisdeq((__v2df)

, (__v2df)

);

1179 return

__builtin_ia32_ucomisdlt((__v2df)

, (__v2df)

);

1203 return

__builtin_ia32_ucomisdle((__v2df)

, (__v2df)

);

1227 return

__builtin_ia32_ucomisdgt((__v2df)

, (__v2df)

);

1251 return

__builtin_ia32_ucomisdge((__v2df)

, (__v2df)

);

1275 return

__builtin_ia32_ucomisdneq((__v2df)

, (__v2df)

);

1292 return

__builtin_ia32_cvtpd2ps((__v2df)

);

1311 return

(__m128d) __builtin_convertvector(

1312

__builtin_shufflevector((__v4sf)

, (__v4sf)

, 0, 1), __v2df);

1333 return

(__m128d) __builtin_convertvector(

1334

__builtin_shufflevector((__v4si)

, (__v4si)

, 0, 1), __v2df);

1355 return

__builtin_ia32_cvtpd2dq((__v2df)

);

1374 return

__builtin_ia32_cvtsd2si((__v2df)

);

1398 return

(__m128)__builtin_ia32_cvtsd2ss((__v4sf)

, (__v2df)

);

1468 return

(__m128i)__builtin_ia32_cvttpd2dq((__v2df)

);

1488 return

__builtin_ia32_cvttsd2si((__v2df)

);

1507 return __trunc64

(__builtin_ia32_cvtpd2dq((__v2df)

));

1526 return __trunc64

(__builtin_ia32_cvttpd2dq((__v2df)

));

1542 return

(__m128d) __builtin_convertvector((__v2si)

, __v2df);

1573 return

const

__m128d *)__dp;

1589 struct

__mm_load1_pd_struct {

1592 double

__u = ((

const struct

__mm_load1_pd_struct *)__dp)->__u;

1593 return

__extension__(__m128d){__u, __u};

1596#define _mm_load_pd1(dp) _mm_load1_pd(dp) 1613

__m128d __u = *(

const

__m128d *)__dp;

1614 return

__builtin_shufflevector((__v2df)__u, (__v2df)__u, 1, 0);

1632 return

((

const struct

__loadu_pd *)__dp)->__v;

1647 struct

__loadu_si64 {

1650 long long

__u = ((

const struct

__loadu_si64 *)

)->__v;

1651 return

__extension__(__m128i)(__v2di){__u, 0LL};

1666 struct

__loadu_si32 {

1669 int

__u = ((

const struct

__loadu_si32 *)

)->__v;

1670 return

__extension__(__m128i)(__v4si){__u, 0, 0, 0};

1685 struct

__loadu_si16 {

1688 short

__u = ((

const struct

__loadu_si16 *)

)->__v;

1689 return

__extension__(__m128i)(__v8hi){__u, 0, 0, 0, 0, 0, 0, 0};

1704 struct

__mm_load_sd_struct {

1707 double

__u = ((

const struct

__mm_load_sd_struct *)__dp)->__u;

1708 return

__extension__(__m128d){__u, 0};

1729 double const

*__dp) {

1730 struct

__mm_loadh_pd_struct {

1733 double

__u = ((

const struct

__mm_loadh_pd_struct *)__dp)->__u;

1734 return

__extension__(__m128d){

[0], __u};

1755 double const

*__dp) {

1756 struct

__mm_loadl_pd_struct {

1759 double

__u = ((

const struct

__mm_loadl_pd_struct *)__dp)->__u;

1760 return

__extension__(__m128d){__u,

[1]};

1775 return

(__m128d)__builtin_ia32_undef128();

1793 return

__extension__(__m128d){__w, 0.0};

1809 return

__extension__(__m128d){__w, __w};

1844 return

__extension__(__m128d){__x, __w};

1864 return

__extension__(__m128d){__w, __x};

1877 return

__extension__(__m128d){0.0, 0.0};

1914 struct

__mm_store_sd_struct {

1917

((

struct

__mm_store_sd_struct *)__dp)->__u =

[0];

1935

*(__m128d *)__dp =

;

1954 __a

= __builtin_shufflevector((__v2df)

, (__v2df)

, 0, 0);

1991 struct

__storeu_pd {

1994

((

struct

__storeu_pd *)__dp)->__v =

;

2013 __a

= __builtin_shufflevector((__v2df)

, (__v2df)

, 1, 0);

2014

*(__m128d *)__dp =

;

2030 struct

__mm_storeh_pd_struct {

2033

((

struct

__mm_storeh_pd_struct *)__dp)->__u =

[1];

2049 struct

__mm_storeh_pd_struct {

2052

((

struct

__mm_storeh_pd_struct *)__dp)->__u =

[0];

2073 return

(__m128i)((__v16qu)

+ (__v16qu)

);

2094 return

(__m128i)((__v8hu)

+ (__v8hu)

);

2115 return

(__m128i)((__v4su)

+ (__v4su)

);

2131 return

(__m64)(((

unsigned long

long)

) + ((

unsigned long

long)

));

2152 return

(__m128i)((__v2du)

+ (__v2du)

);

2174 return

(__m128i)__builtin_elementwise_add_sat((__v16qs)

, (__v16qs)

);

2196 return

(__m128i)__builtin_elementwise_add_sat((__v8hi)

, (__v8hi)

);

2218 return

(__m128i)__builtin_elementwise_add_sat((__v16qu)

, (__v16qu)

);

2240 return

(__m128i)__builtin_elementwise_add_sat((__v8hu)

, (__v8hu)

);

2259 return

(__m128i)__builtin_ia32_pavgb128((__v16qi)

, (__v16qi)

);

2278 return

(__m128i)__builtin_ia32_pavgw128((__v8hi)

, (__v8hi)

);

2303 return

(__m128i)__builtin_ia32_pmaddwd128((__v8hi)

, (__v8hi)

);

2322 return

(__m128i)__builtin_elementwise_max((__v8hi)

, (__v8hi)

);

2341 return

(__m128i)__builtin_elementwise_max((__v16qu)

, (__v16qu)

);

2360 return

(__m128i)__builtin_elementwise_min((__v8hi)

, (__v8hi)

);

2379 return

(__m128i)__builtin_elementwise_min((__v16qu)

, (__v16qu)

);

2398 return

(__m128i)__builtin_ia32_pmulhw128((__v8hi)

, (__v8hi)

);

2417 return

(__m128i)__builtin_ia32_pmulhuw128((__v8hi)

, (__v8hi)

);

2436 return

(__m128i)((__v8hu)

* (__v8hu)

);

2472 return

__builtin_ia32_pmuludq128((__v4si)

, (__v4si)

);

2493 return

__builtin_ia32_psadbw128((__v16qi)

, (__v16qi)

);

2510 return

(__m128i)((__v16qu)

- (__v16qu)

);

2527 return

(__m128i)((__v8hu)

- (__v8hu)

);

2544 return

(__m128i)((__v4su)

- (__v4su)

);

2561 return

(__m64)((

unsigned long

long)

- (

unsigned long long

)

);

2578 return

(__m128i)((__v2du)

- (__v2du)

);

2600 return

(__m128i)__builtin_elementwise_sub_sat((__v16qs)

, (__v16qs)

);

2622 return

(__m128i)__builtin_elementwise_sub_sat((__v8hi)

, (__v8hi)

);

2643 return

(__m128i)__builtin_elementwise_sub_sat((__v16qu)

, (__v16qu)

);

2664 return

(__m128i)__builtin_elementwise_sub_sat((__v8hu)

, (__v8hu)

);

2681 return

(__m128i)((__v2du)

& (__v2du)

);

2700 return

(__m128i)(~(__v2du)

& (__v2du)

);

2716 return

(__m128i)((__v2du)

| (__v2du)

);

2733 return

(__m128i)((__v2du)

^ (__v2du)

);

2753#define _mm_slli_si128(a, imm) \ 2754 ((__m128i)__builtin_ia32_pslldqi128_byteshift((__v2di)(__m128i)(a), \ 2757#define _mm_bslli_si128(a, imm) \ 2758 ((__m128i)__builtin_ia32_pslldqi128_byteshift((__v2di)(__m128i)(a), \ 2776 return

(__m128i)__builtin_ia32_psllwi128((__v8hi)

, __count);

2794 return

(__m128i)__builtin_ia32_psllw128((__v8hi)

, (__v8hi)__count);

2812 return

(__m128i)__builtin_ia32_pslldi128((__v4si)

, __count);

2830 return

(__m128i)__builtin_ia32_pslld128((__v4si)

, (__v4si)__count);

2848 return

__builtin_ia32_psllqi128((__v2di)

, __count);

2866 return

__builtin_ia32_psllq128((__v2di)

, (__v2di)__count);

2885 return

(__m128i)__builtin_ia32_psrawi128((__v8hi)

, __count);

2904 return

(__m128i)__builtin_ia32_psraw128((__v8hi)

, (__v8hi)__count);

2923 return

(__m128i)__builtin_ia32_psradi128((__v4si)

, __count);

2942 return

(__m128i)__builtin_ia32_psrad128((__v4si)

, (__v4si)__count);

2962#define _mm_srli_si128(a, imm) \ 2963 ((__m128i)__builtin_ia32_psrldqi128_byteshift((__v2di)(__m128i)(a), \ 2966#define _mm_bsrli_si128(a, imm) \ 2967 ((__m128i)__builtin_ia32_psrldqi128_byteshift((__v2di)(__m128i)(a), \ 2985 return

(__m128i)__builtin_ia32_psrlwi128((__v8hi)

, __count);

3003 return

(__m128i)__builtin_ia32_psrlw128((__v8hi)

, (__v8hi)__count);

3021 return

(__m128i)__builtin_ia32_psrldi128((__v4si)

, __count);

3039 return

(__m128i)__builtin_ia32_psrld128((__v4si)

, (__v4si)__count);

3057 return

__builtin_ia32_psrlqi128((__v2di)

, __count);

3075 return

__builtin_ia32_psrlq128((__v2di)

, (__v2di)__count);

3094 return

(__m128i)((__v16qi)

== (__v16qi)

);

3113 return

(__m128i)((__v8hi)

== (__v8hi)

);

3132 return

(__m128i)((__v4si)

== (__v4si)

);

3154 return

(__m128i)((__v16qs)

> (__v16qs)

);

3174 return

(__m128i)((__v8hi)

> (__v8hi)

);

3194 return

(__m128i)((__v4si)

> (__v4si)

);

3276

_mm_cvtsi64_sd(__m128d

long long __b

) {

3297 return

__builtin_ia32_cvtsd2si64((__v2df)

);

3317 return

__builtin_ia32_cvttsd2si64((__v2df)

);

3332 return

(__m128) __builtin_convertvector((__v4si)

, __v4sf);

3350 return

(__m128i)__builtin_ia32_cvtps2dq((__v4sf)

);

3369 return

(__m128i)__builtin_ia32_cvttps2dq((__v4sf)

);

3383 return

__extension__(__m128i)(__v4si){

, 0, 0, 0};

3398 return

__extension__(__m128i)(__v2di){

, 0};

3413

__v4si

= (__v4si)

;

3459 struct

__loadu_si128 {

3462 return

((

const struct

__loadu_si128 *)

)->__v;

3479 struct

__mm_loadl_epi64_struct {

3482 return

__extension__(__m128i){

3483

((

const struct

__mm_loadl_epi64_struct *)

)->__u, 0};

3496 return

(__m128i)__builtin_ia32_undef128();

3517 return

__extension__(__m128i)(__v2di){__q0, __q1};

3538 return _mm_set_epi64x

((

long long

)__q1[0], (

long long

)__q0[0]);

3567 return

__extension__(__m128i)(__v4si){__i0, __i1, __i2, __i3};

3606 short

__w2,

short

__w1,

short

__w0) {

3607 return

__extension__(__m128i)(__v8hi){__w0, __w1, __w2, __w3,

3608

__w4, __w5, __w6, __w7};

3655 char

__b10,

char

__b9,

char

__b8,

char

__b7,

char

__b6,

char

__b5,

3656 char

__b4,

char

__b3,

char

__b2,

char

__b1,

char

__b0) {

3657 return

__extension__(__m128i)(__v16qi){

3658

__b0, __b1, __b2, __b3, __b4, __b5, __b6, __b7,

3659

__b8, __b9, __b10, __b11, __b12, __b13, __b14, __b15};

3730 return _mm_set_epi16

(__w, __w, __w, __w, __w, __w, __w, __w);

3747 return _mm_set_epi8

(

3819 short

__w5,

short

__w6,

short

__w7) {

3820 return _mm_set_epi16

(__w7, __w6, __w5, __w4, __w3, __w2, __w1, __w0);

3865_mm_setr_epi8

(

char

__b0,

char

__b1,

char

__b2,

char

__b3,

char

__b4,

char

__b5,

3866 char

__b6,

char

__b7,

char

__b8,

char

__b9,

char

__b10,

3867 char

__b11,

char

__b12,

char

__b13,

char

__b14,

char

__b15) {

3868 return _mm_set_epi8

(__b15, __b14, __b13, __b12, __b11, __b10, __b9, __b8,

3869

__b7, __b6, __b5, __b4, __b3, __b2, __b1, __b0);

3881 return

__extension__(__m128i)(__v2di){0LL, 0LL};

3913 struct

__storeu_si128 {

3916

((

struct

__storeu_si128 *)

)->__v =

;

3933 struct

__storeu_si64 {

3936

((

struct

__storeu_si64 *)

)->__v = ((__v2di)

)[0];

3953 struct

__storeu_si32 {

3956

((

struct

__storeu_si32 *)

)->__v = ((__v4si)

)[0];

3973 struct

__storeu_si16 {

3976

((

struct

__storeu_si16 *)

)->__v = ((__v8hi)

)[0];

4003

__builtin_ia32_maskmovdqu((__v16qi)__d, (__v16qi)__n,

);

4021 struct

__mm_storel_epi64_struct {

4024

((

struct

__mm_storel_epi64_struct *)

)->__u =

[0];

4043

__builtin_nontemporal_store((__v2df)

, (__v2df *)

);

4061

__builtin_nontemporal_store((__v2di)

, (__v2di *)

);

4077static

__inline__

void 4080

__builtin_ia32_movnti((

int

);

4097static

__inline__

void 4098 __attribute__

((__always_inline__, __nodebug__, __target__(

"sse2"

)))

4099

_mm_stream_si64(

void

long long __a

) {

4100

__builtin_ia32_movnti64((

long long

);

4104#if defined(__cplusplus) 4142#if defined(__cplusplus) 4166 return

(__m128i)__builtin_ia32_packsswb128((__v8hi)

, (__v8hi)

);

4189 return

(__m128i)__builtin_ia32_packssdw128((__v4si)

, (__v4si)

);

4212 return

(__m128i)__builtin_ia32_packuswb128((__v8hi)

, (__v8hi)

);

4241#define _mm_extract_epi16(a, imm) \ 4242 ((int)(unsigned short)__builtin_ia32_vec_ext_v8hi((__v8hi)(__m128i)(a), \ 4269#define _mm_insert_epi16(a, b, imm) \ 4270 ((__m128i)__builtin_ia32_vec_set_v8hi((__v8hi)(__m128i)(a), (int)(b), \ 4286 return

__builtin_ia32_pmovmskb128((__v16qi)

);

4320#define _mm_shuffle_epi32(a, imm) \ 4321 ((__m128i)__builtin_ia32_pshufd((__v4si)(__m128i)(a), (int)(imm))) 4353#define _mm_shufflelo_epi16(a, imm) \ 4354 ((__m128i)__builtin_ia32_pshuflw((__v8hi)(__m128i)(a), (int)(imm))) 4386#define _mm_shufflehi_epi16(a, imm) \ 4387 ((__m128i)__builtin_ia32_pshufhw((__v8hi)(__m128i)(a), (int)(imm))) 4420 return

(__m128i)__builtin_shufflevector(

4421

(__v16qi)

, (__v16qi)

, 8, 16 + 8, 9, 16 + 9, 10, 16 + 10, 11,

4422

16 + 11, 12, 16 + 12, 13, 16 + 13, 14, 16 + 14, 15, 16 + 15);

4448 return

(__m128i)__builtin_shufflevector((__v8hi)

, (__v8hi)

, 4, 8 + 4, 5,

4449

8 + 5, 6, 8 + 6, 7, 8 + 7);

4471 return

(__m128i)__builtin_shufflevector((__v4si)

, (__v4si)

, 2, 4 + 2, 3,

4492 return

(__m128i)__builtin_shufflevector((__v2di)

, (__v2di)

, 1, 2 + 1);

4526 return

(__m128i)__builtin_shufflevector(

4527

(__v16qi)

, (__v16qi)

, 0, 16 + 0, 1, 16 + 1, 2, 16 + 2, 3, 16 + 3, 4,

4528

16 + 4, 5, 16 + 5, 6, 16 + 6, 7, 16 + 7);

4555 return

(__m128i)__builtin_shufflevector((__v8hi)

, (__v8hi)

, 0, 8 + 0, 1,

4556

8 + 1, 2, 8 + 2, 3, 8 + 3);

4578 return

(__m128i)__builtin_shufflevector((__v4si)

, (__v4si)

, 0, 4 + 0, 1,

4599 return

(__m128i)__builtin_shufflevector((__v2di)

, (__v2di)

, 0, 2 + 0);

4615 return

(__m64)

[0];

4668 return

__builtin_shufflevector((__v2df)

, (__v2df)

, 1, 2 + 1);

4688 return

__builtin_shufflevector((__v2df)

, (__v2df)

, 0, 2 + 0);

4705 return

__builtin_ia32_movmskpd((__v2df)

);

4735#define _mm_shuffle_pd(a, b, i) \ 4736 ((__m128d)__builtin_ia32_shufpd((__v2df)(__m128d)(a), (__v2df)(__m128d)(b), \ 4752 return

(__m128)

;

4768 return

(__m128i)

;

4784 return

(__m128d)

;

4800 return

(__m128i)

;

4816 return

(__m128)

;

4832 return

(__m128d)