cmla_rot270.h - mozsearch

/* SPDX-License-Identifier: MIT

* Permission is hereby granted, free of charge, to any person

* obtaining a copy of this software and associated documentation

* files (the "Software"), to deal in the Software without

* restriction, including without limitation the rights to use, copy,

* modify, merge, publish, distribute, sublicense, and/or sell copies

* of the Software, and to permit persons to whom the Software is

* furnished to do so, subject to the following conditions:

* The above copyright notice and this permission notice shall be

* included in all copies or substantial portions of the Software.

* THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,

* EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF

* MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND

* NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS

* BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN

* ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN

* CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE

* SOFTWARE.

* Copyright:

*   2021      Atharva Nimbalkar <atharvakn@gmail.com>

*/

#if !defined(SIMDE_ARM_NEON_CMLA_ROT270_H)

#define SIMDE_ARM_NEON_CMLA_ROT270_H

#include "types.h"

HEDLEY_DIAGNOSTIC_PUSH

SIMDE_DISABLE_UNWANTED_DIAGNOSTICS

SIMDE_BEGIN_DECLS_

SIMDE_FUNCTION_ATTRIBUTES

simde_float32x2_t

simde_vcmla_rot270_f32(simde_float32x2_t r, simde_float32x2_t a, simde_float32x2_t b) {

  #if defined(SIMDE_ARM_NEON_A32V8_NATIVE) && SIMDE_ARCH_ARM_CHECK(8,3) && \

      (!defined(HEDLEY_GCC_VERSION) || HEDLEY_GCC_VERSION_CHECK(9,0,0)) && \

      (!defined(__clang__) || SIMDE_DETECT_CLANG_VERSION_CHECK(12,0,0))

    return vcmla_rot270_f32(r, a, b);

  #else

    simde_float32x2_private

      r_ = simde_float32x2_to_private(r),

      a_ = simde_float32x2_to_private(a),

      b_ = simde_float32x2_to_private(b);

    #if defined(SIMDE_SHUFFLE_VECTOR_) && !defined(SIMDE_BUG_GCC_100760)

      a_.values = SIMDE_SHUFFLE_VECTOR_(32, 8, a_.values, a_.values, 1, 1);

      b_.values = SIMDE_SHUFFLE_VECTOR_(32, 8, -b_.values, b_.values, 3, 0);

      r_.values += b_.values * a_.values;

    #else

      SIMDE_VECTORIZE

      for (size_t i = 0 ; i < (sizeof(r_.values) / (2 * sizeof(r_.values[0]))) ; i++) {

        r_.values[2 * i] += b_.values[2 * i + 1] * a_.values[2 * i + 1];

        r_.values[2 * i + 1] += -(b_.values[2 * i]) * a_.values[2 * i + 1];

    #endif

    return simde_float32x2_from_private(r_);

  #endif

#if defined(SIMDE_ARM_NEON_A32V8_ENABLE_NATIVE_ALIASES)

  #undef vcmla_rot270_f32

  #define vcmla_rot270_f32(r, a, b) simde_vcmla_rot270_f32(r, a, b)

#endif

SIMDE_FUNCTION_ATTRIBUTES

simde_float32x4_t

simde_vcmlaq_rot270_f32(simde_float32x4_t r, simde_float32x4_t a, simde_float32x4_t b) {

  #if defined(SIMDE_ARM_NEON_A32V8_NATIVE) && SIMDE_ARCH_ARM_CHECK(8,3) && \

      (!defined(HEDLEY_GCC_VERSION) || HEDLEY_GCC_VERSION_CHECK(9,0,0)) && \

      (!defined(__clang__) || SIMDE_DETECT_CLANG_VERSION_CHECK(12,0,0))

    return vcmlaq_rot270_f32(r, a, b);

  #else

    simde_float32x4_private

      r_ = simde_float32x4_to_private(r),

      a_ = simde_float32x4_to_private(a),

      b_ = simde_float32x4_to_private(b);

    #if defined(SIMDE_WASM_SIMD128_NATIVE)

      a_.v128 = wasm_i32x4_shuffle(a_.v128, a_.v128, 1, 1, 3, 3);

      b_.v128 = wasm_i32x4_shuffle(wasm_f32x4_neg(b_.v128), b_.v128, 5, 0, 7, 2);

      r_.v128 = wasm_f32x4_add(r_.v128, wasm_f32x4_mul(b_.v128, a_.v128));

    #elif defined(SIMDE_SHUFFLE_VECTOR_)

      a_.values = SIMDE_SHUFFLE_VECTOR_(32, 16, a_.values, a_.values, 1, 1, 3, 3);

      b_.values = SIMDE_SHUFFLE_VECTOR_(32, 16, -b_.values, b_.values, 5, 0, 7, 2);

      r_.values += b_.values * a_.values;

    #else

      SIMDE_VECTORIZE

      for (size_t i = 0 ; i < (sizeof(r_.values) / (2 * sizeof(r_.values[0]))) ; i++) {

        r_.values[2 * i] += b_.values[2 * i + 1] * a_.values[2 * i + 1];

        r_.values[2 * i + 1] += -(b_.values[2 * i]) * a_.values[2 * i + 1];

    #endif

    return simde_float32x4_from_private(r_);

  #endif

#if defined(SIMDE_ARM_NEON_A32V8_ENABLE_NATIVE_ALIASES)

  #undef vcmlaq_rot270_f32

  #define vcmlaq_rot270_f32(r, a, b) simde_vcmlaq_rot270_f32(r, a, b)

#endif

SIMDE_FUNCTION_ATTRIBUTES

simde_float64x2_t

simde_vcmlaq_rot270_f64(simde_float64x2_t r, simde_float64x2_t a, simde_float64x2_t b) {

  #if defined(SIMDE_ARM_NEON_A64V8_NATIVE) && SIMDE_ARCH_ARM_CHECK(8,3) && \

      (!defined(HEDLEY_GCC_VERSION) || HEDLEY_GCC_VERSION_CHECK(9,0,0)) && \

      (!defined(__clang__) || SIMDE_DETECT_CLANG_VERSION_CHECK(12,0,0))

    return vcmlaq_rot270_f64(r, a, b);

  #else

    simde_float64x2_private

      r_ = simde_float64x2_to_private(r),

      a_ = simde_float64x2_to_private(a),

      b_ = simde_float64x2_to_private(b);

    #if defined(SIMDE_WASM_SIMD128_NATIVE)

      a_.v128 = wasm_i64x2_shuffle(a_.v128, a_.v128, 1, 1);

      b_.v128 = wasm_i64x2_shuffle(wasm_f64x2_neg(b_.v128), b_.v128, 3, 0);

      r_.v128 = wasm_f64x2_add(r_.v128, wasm_f64x2_mul(b_.v128, a_.v128));

    #elif defined(SIMDE_SHUFFLE_VECTOR_)

      a_.values = SIMDE_SHUFFLE_VECTOR_(64, 16, a_.values, a_.values, 1, 1);

      b_.values = SIMDE_SHUFFLE_VECTOR_(64, 16, -b_.values, b_.values, 3, 0);

      r_.values += b_.values * a_.values;

    #else

      SIMDE_VECTORIZE

      for (size_t i = 0 ; i < (sizeof(r_.values) / (2 * sizeof(r_.values[0]))) ; i++) {

        r_.values[2 * i] += b_.values[2 * i + 1] * a_.values[2 * i + 1];

        r_.values[2 * i + 1] += -(b_.values[2 * i]) * a_.values[2 * i + 1];

    #endif

    return simde_float64x2_from_private(r_);

  #endif

#if defined(SIMDE_ARM_NEON_A32V8_ENABLE_NATIVE_ALIASES)

  #undef vcmlaq_rot270_f64

  #define vcmlaq_rot270_f64(r, a, b) simde_vcmlaq_rot270_f64(r, a, b)

#endif

SIMDE_END_DECLS_

HEDLEY_DIAGNOSTIC_POP

#endif /* !defined(SIMDE_ARM_NEON_CMLA_ROT270_H) */