2 years agoSetup clang-format as an Arcanist linter
Setup clang-format as an Arcanist linter

This uses clang-format-diff as a linter for Arcanist.

`arc lint` flow, also run as part of `arc diff` unless skipped with
`--nolint`, will now run the linter shell script on the changed files,
and prompt the user to accept the suggested changes.

Message when clang-format-diff is not installed:

Example of the noise during code review when clang-format-diff is not installed:

Prompt when clang-format-diff is installed and suggests edits:

2 years agoAdd /bigobj for SPIRV dialect on MSVC.
Add /bigobj for SPIRV dialect on MSVC.

Summary: This object file has grown beyond the default limit, and elsewhere in LLVM, we seem to be setting this flag as a one-off, so continuing that here.

2 years agoAMDGPU/GlobalISel: Basic legalize rules for G_FSHR
AMDGPU/GlobalISel: Basic legalize rules for G_FSHR

Only handles easy 32-bit cases.

2 years ago[Intrinsic] Give "is.constant" the "convergent" attribute
[Intrinsic] Give "is.constant" the "convergent" attribute

Code frequently relies upon the results of "is.constant" intrinsics to
DCE invalid code paths. We don't want the intrinsic to be made control-
dependent on any additional values. For instance, we can't split a PHI
into a "constant" and "non-constant" part via jump threading in order
to "optimize" the constant part, because the "is.constant" intrinsic is
meant to return "false".

2 years ago[clang analysis] Make mutex guard detection more reliable.
[clang analysis] Make mutex guard detection more reliable.

-Wthread-safety was failing to detect certain AST patterns it should
detect. Make the pattern detection a bit more comprehensive.

Due to an unrelated bug involving template instantiation, this showed up
as a regression in 10.0 vs. 9.0 in the original bug report. The included
testcase fails on older versions of clang, though.

Fixes https://bugs.llvm.org/show_bug.cgi?id=45323 .

Differential Revision: https://reviews.llvm.org/D76943

2 years agofix a comment grammar-o
fix a comment grammar-o

2 years ago[lldb/CMake] Make check-lldb-* work for the standalone build.
[lldb/CMake] Make check-lldb-* work for the standalone build.

In order to run check-lldb-* we need the correct map_config directives
in llvm-lit. For the standalone build, LLVM doesn't know about LLDB, and
the lldb mappings are missing. In that case we build our own llvm-lit,
and tell LLVM to use the llvm-lit in the lldb build directory.

Differential revision: https://reviews.llvm.org/D76945

2 years agoGlobalISel: Add accessor to known bits to CombinerHelper
GlobalISel: Add accessor to known bits to CombinerHelper

I need to pass known bits to a target combine matcher (which for some
reason aren't methods in a subclass of CombinerHelper?)

2 years agoGlobalISel: Translate llvm.fshl/llvm.fshr
Matt Arsenault [Fri, 20 Mar 2020 00:46:08 +0000 (20:46 -0400)]
GlobalISel: Translate llvm.fshl/llvm.fshr

2 years agolld: Reduce number of references to undefined printed from 10 to 3.
lld: Reduce number of references to undefined printed from 10 to 3.

As of a while ago, lld groups all undefined references to a single
symbol in a single diagnostic. Back then, I made it so that we
print up to 10 references to each undefined symbol.

Having used this for a while, I never wished there were more
references, but I sometimes found that this can print a lot of
output. lld prints up to 10 diagnostics by default, and if
each has 10 references (which I've seen in practice), and each
undefined symbol produces 2 (possibly very long) lines of output,
that's over 200 lines of error output.

Let's try it with just 3 references for a while and see how
that feels in practice.

Differential Revision: https://reviews.llvm.org/D77017

2 years ago[ConstantFold][NFC] Compile time optimization for large vectors
Thomas Raoux [Mon, 30 Mar 2020 17:36:21 +0000 (10:36 -0700)]
[ConstantFold][NFC] Compile time optimization for large vectors

Optimize the common case of splat vector constant. For large vector
going through all elements is expensive. For splatr/broadcast cases we
can skip going through all elements.

Differential Revision: https://reviews.llvm.org/D76664

2 years ago[gn build] Port 3cbbded68c2
[gn build] Port 3cbbded68c2

2 years agoMove CLANG_SYSTEMZ_DEFAULT_ARCH to config.h.
Nico Weber [Mon, 30 Mar 2020 18:11:35 +0000 (14:11 -0400)]

Instead of using a global define; see comments on D75914.

While here, port 9c9d88d8b1b to the GN build.

2 years ago[MLIR] Fix permuteLoops utility
[MLIR] Fix permuteLoops utility

Rewrite mlir::permuteLoops (affine loop permutation utility) to fix
incorrect approach. Avoiding using sinkLoops entirely - use single move
approach. Add test pass.

This fixes https://bugs.llvm.org/show_bug.cgi?id=45328

Depends on D77003.

Signed-off-by: Uday Bondhugula <uday@polymagelabs.com>
Differential Revision: https://reviews.llvm.org/D77004

2 years ago[AMDGPU] Add Relocation Constant Support
[AMDGPU] Add Relocation Constant Support

This change adds amdgcn.reloc.constant intrinsic to the amdgpu backend, which will compile into a relocation entry in the resulting elf.

The intrinsics takes a MetadataNode (String) as its only argument, which specifies the symbol name of the relocation entry.

`SelectionDAGBuilder::getValueImpl` is changed to allow metadata operands passed through to ISel.

Author: csyonghe <yonghe@google.com>

2 years ago[OPENMP50]Add codegen support for array shaping expression in depend
[OPENMP50]Add codegen support for array shaping expression in depend

Implemented codegen for array shaping operation in depend clauses. The
begin of the expression is the pointer itself, while the size of the
dependence data is the mukltiplacation of all dimensions in the array
shaping expression.

2 years ago[Hexagon] MaxAtomicPromoteWidth and MaxAtomicInlineWidth are not getting set.
[Hexagon] MaxAtomicPromoteWidth and MaxAtomicInlineWidth are not getting set.

Noticed when building llvm's c++ library.

Differential Revision: https://reviews.llvm.org/D76546

2 years agoIntroduce unify-loop-exits pass.
Introduce unify-loop-exits pass.

For each natural loop with multiple exit blocks, this pass creates a
new block N such that all exiting blocks now branch to N, and then
control flow is redistributed to all the original exit blocks.

The bulk of the tranformation is a new function introduced in
BasicBlockUtils that an redirect control flow from a set of incoming
blocks to a set of outgoing blocks via a common "hub".

This is a useful workaround for a limitation in the structurizer which
incorrectly orders blocks when processing a nest of loops. This pass
bypasses that issue by ensuring that each natural loop is recognized
as a separate region. Since the structurizer is a region pass, it no
longer sees a nest of loops in a single region, and instead processes
each "level" in the nesting as a separate region.

The AMDGPU backend provides a new option to enable this pass before
the structurizer, which may eventually be enabled by default.

2 years ago[LoopVectorize] Fix crash on "getNoopOrZeroExtend cannot truncate!" (PR45259)
[LoopVectorize] Fix crash on "getNoopOrZeroExtend cannot truncate!" (PR45259)

In InnerLoopVectorizer::getOrCreateTripCount, when the backedge taken
count is a SCEV add expression, its type is defined by the type of the
last operand of the add expression.

In the test case from PR45259, this last operand happens to be a
pointer, which (according to llvm::Type) does not have a primitive size
in bits. In this case, LoopVectorize fails to truncate the SCEV and
crashes as a result.

Uing ScalarEvolution::getTypeSizeInBits makes the truncation work as expected.


Differential Revision: https://reviews.llvm.org/D76669

2 years ago[ELF] Allow SHF_LINK_ORDER and non-SHF_LINK_ORDER to be mixed
Fangrui Song [Sun, 29 Mar 2020 06:12:04 +0000 (23:12 -0700)]
[ELF] Allow SHF_LINK_ORDER and non-SHF_LINK_ORDER to be mixed

Currently, `error: incompatible section flags for .rodata` is reported
when we mix SHF_LINK_ORDER and non-SHF_LINK_ORDER sections in an output section.

This is overconstrained. This patch allows mixed flags with the
requirement that SHF_LINK_ORDER sections must be contiguous. Mixing
flags is used by Linux aarch64 (https://github.com/ClangBuiltLinux/linux/issues/953)

  .init.data : { ... KEEP(*(__patchable_function_entries)) ... }

When the integrated assembler is enabled, clang's -fpatchable-function-entry=N[,M]
implementation sets the SHF_LINK_ORDER flag (D72215) to fix a number of
garbage collection issues.

Strictly speaking, the ELF specification does not require contiguous
SHF_LINK_ORDER sections but for many current uses of SHF_LINK_ORDER like
.ARM.exidx/__patchable_function_entries there has been a requirement for
the sections to be contiguous on top of the requirements of the ELF

This patch also imposes one restriction: SHF_LINK_ORDER sections cannot
be separated by a symbol assignment or a BYTE command. Not allowing BYTE
is a natural extension that a non-SHF_LINK_ORDER cannot be a separator.
Symbol assignments can delimiter the contents of SHF_LINK_ORDER
sections.  Allowing SHF_LINK_ORDER sections across symbol assignments
(especially __start_/__stop_) can make things hard to explain. The
restriction should not be a problem for practical use cases.

Reviewed By: psmith

Differential Revision: https://reviews.llvm.org/D77007

2 years ago[libc++] Fix wrong default value for LIBCXX_ENABLE_ASSERTIONS in documentation
[libc++] Fix wrong default value for LIBCXX_ENABLE_ASSERTIONS in documentation

It's set to OFF by default at libcxx/CMakeLists.txt:73.

Differential Revision: https://reviews.llvm.org/D76905

2 years ago[libc++] Add support for a new keyword ADDITIONAL_COMPILE_FLAGS
[libc++] Add support for a new keyword ADDITIONAL_COMPILE_FLAGS

This allows adding compilation flags for a single test, which can help
eliminate some .sh.cpp tests and some custom handling in the libc++
test format.

It also works around the issue that .sh.cpp substitutions are _not_
equivalent to the actual compiler command lines used to compile tests,
since the compiler flags can be modified in local lit configurations,
and substitutions are frozen at that point. For example using %{compile}
in a .sh.cpp test in the coroutines subdirectory will not include the
-fcoroutines-ts flag, which is added in the local lit config, because
the %{compile} substitution is created long before we add -fcoroutines-ts
to the compiler flags (in the lit.local.cfg for coroutines).

2 years ago[ELF][test] Improve linkerscript/linkorder.s
Fangrui Song [Sun, 29 Mar 2020 06:11:55 +0000 (23:11 -0700)]
[ELF][test] Improve linkerscript/linkorder.s

2 years ago[X86] make sure POP has implicit def/use of stack pointer when materializing 8-bit...
[X86] make sure POP has implicit def/use of stack pointer when materializing 8-bit immediates for minsize

Otherwise PostRA list scheduler may reorder instruction, such as

schedule this
pushq  $0x8
pop    %rbx
lea    0x2a0(%rsp),%r15
pushq  $0x8
lea    0x2a0(%rsp),%r15
pop    %rbx
by mistake. The patch is to prevent this to happen by making sure POP has
implicit use of SP.

2 years ago[analyzer] Add core.CallAndMessage to StdCLibraryFunctionArgsChecker's dependency
[analyzer] Add core.CallAndMessage to StdCLibraryFunctionArgsChecker's dependency

2 years ago[Alignment][NFC] Use Align version of getMachineMemOperand
[Alignment][NFC] Use Align version of getMachineMemOperand

This is patch is part of a series to introduce an Alignment type.
See this thread for context: http://lists.llvm.org/pipermail/llvm-dev/2019-July/133851.html
See this patch for the introduction of the type: https://reviews.llvm.org/D64790

2 years agoRevert "[lldb] Fix TestSettings.test_pass_host_env_vars on windows"
Revert "[lldb] Fix TestSettings.test_pass_host_env_vars on windows"

This reverts commit because of test failures in TestHelloWorld.

It seems that this test (specifically running "ls" as a platform shell
command) depended on the implicit passing of the host environment.

The fix should be fairly simple (inherit the environment explicitly),
but it may take me a while to figure where exactly to do that. Revert
while I am figuring that out.

2 years agoGlobalISel: Minor cleanups
GlobalISel: Minor cleanups

2 years ago[libc++] Avoid duplicating logic in the libcxx-specific filesystem local lit config
[libc++] Avoid duplicating logic in the libcxx-specific filesystem local lit config

This will become more relevant as we shift more filesystem-specific
logic to the local lit configuration in test/std/input.output/filesystems.

2 years agoAMDGPU/GlobalISel: Hack to fix i24 argument lowering
AMDGPU/GlobalISel: Hack to fix i24 argument lowering

I still think the call lowering type legalization logic split between
the generic code and target is too confusing, but largely induced by
the reliance on the DAG infrastructure.

2 years agoAMDGPU/GlobalISel: Legalize 64-bit G_UDIV/G_UREM
AMDGPU/GlobalISel: Legalize 64-bit G_UDIV/G_UREM

Mostly ported from the DAG version. This results in much worse code
than the DAG version, largely due to a much worse expansion for

2 years ago[DebugInfo] Ensure that a demanded bits optimisation in
[DebugInfo]  Ensure that a demanded bits optimisation in
InstCombine does not result in an incorrect debuginfo variable

- Add an additional salvage and a test.

2 years agoRevert "[Darwin] Respect -fno-unroll-loops during LTO."
Revert "[Darwin] Respect -fno-unroll-loops during LTO."

As per post-commit comment at https://reviews.llvm.org/D76916, this
should better be done at the TU level.

This reverts commit 9ce198d6ed371399e9bd9ba8b48fbab0f4e60240.

2 years ago[LLDB] Initialize temporary token
[LLDB] Initialize temporary token

Found by msan.

2 years ago[lldb] Fix TestSettings.test_pass_host_env_vars on windows
[lldb] Fix TestSettings.test_pass_host_env_vars on windows

A defensive check in ProcessLauncherWindows meant that we would never
attempt to launch a process with a completely empty environment -- the
host environment would be used instead. Instead, I make the function add
an extra null wchar_t at the end of an empty environment. The
documentation on this is a bit fuzzy, but it seems to be what is needed
to make windows accept these kinds of environments.

2 years ago[analyzer][MallocChecker][NFC] Split checkPostCall up, deploy CallDescriptionMap
[analyzer][MallocChecker][NFC] Split checkPostCall up, deploy CallDescriptionMap

Since its important to know whether a function frees memory (even if its a
reallocating function!), I used two CallDescriptionMaps to merge all
CallDescriptions into it. MemFunctionInfoTy no longer makes sense, it may never
have, but for now, it would be more of a distraction then anything else.

Differential Revision: https://reviews.llvm.org/D68165

2 years ago[lldb] Fix another crash in covariant type handling
[lldb] Fix another crash in covariant type handling

D73024 seems to have fixed one set crash, but it introduced another.
Namely, if a class contains a covariant method returning itself, the
logic in MaybeCompleteReturnType could cause us to attempt a recursive
import, which would result in an assertion failure in

For some reason, this only manifested itself if the class contained at
least two member variables, and the class itself was imported as a
result of a recursive covariant import.

This patch fixes the crash by not attempting to import classes which are
already completed in MaybeCompleteReturnType. However, it's not clear to
me if this is the right fix, or if this should be handled automatically
by functions lower in the stack.

2 years ago[DebugInfo] Ensure dead store elimination can mark an operand
[DebugInfo] Ensure dead store elimination can mark an operand
value as undefined

    - Correct a debug info salvage and add a test

2 years agoRemove legacy CMake targets for libcxx and libcxxabi
Remove legacy CMake targets for libcxx and libcxxabi

We've been meaning to remove those targets for a while, and the fix is
simple enough cause they're all just aliases to other targets.

This is a re-application of f383fb40b17, wich was reverted in 04d48111b
because the build bots had not been updated yet. The build bot configurations
have now been updated not to use the deprecated targets, and I verified
that they were using the non-deprecated targets, so we should be good
unless I missed a bot.

Differential Revision: https://reviews.llvm.org/D76104

2 years ago[InstCombine] add test for trunc-extelt; NFC
[InstCombine] add test for trunc-extelt; NFC

Goes with D76983

2 years ago[OPENMP50]Add basic support for array-shaping operation.
[OPENMP50]Add basic support for array-shaping operation.

Added basic representation and parsing/sema handling of array-shaping
operations. Array shaping expression is an expression of form ([s0]..[sn])base,
where s0, ..., sn must be a positive integer, base - a pointer. This
expression is a kind of cast operation that converts pointer expression
into an array-like kind of expression.

2 years ago[Alignment][NFC] Provide tightened up functions in SelectionDAG, MachineFunction...
[Alignment][NFC] Provide tightened up functions in SelectionDAG, MachineFunction and MachineMemOperand

This is patch is part of a series to introduce an Alignment type.
See this thread for context: http://lists.llvm.org/pipermail/llvm-dev/2019-July/133851.html
See this patch for the introduction of the type: https://reviews.llvm.org/D64790

2 years ago[AST] Fix crashes on decltype(recovery-expr).
[AST] Fix crashes on decltype(recovery-expr).

Summary: We mark these decls as invalid.

2 years ago[llvm-readobj] - Improve test of --elf-hash-histogram option.
[llvm-readobj] - Improve test of --elf-hash-histogram option.

This test missed the check of histograms printed for .hash sections.
It was removed by mistake in D71606 where I tried to get rid of precompiled objects
and did not realize that time that both SHT_GNU_HASH and SHT_HASH sections
were tested and not just GNU version.

Also it never tested aliases for the --elf-hash-histogram option.

Differential revision: https://reviews.llvm.org/D76920

2 years ago[SystemZ] Allow configuring default CLANG_SYSTEMZ_ARCH
[SystemZ] Allow configuring default CLANG_SYSTEMZ_ARCH

On Ubuntu, we want to raise default CLANG_SYSTEMZ_ARCH to z13,
thus allow configuring this via CMake.
On Debian, we want to raise it to z196.

2 years ago[lldb][NFC] Refactor Fix-It filter for warnings
[lldb][NFC] Refactor Fix-It filter for warnings

LLDB only automatically applies Fix-Its from errors, but not from warnings.

Currently we only store Fix-Its from errors and then later apply all Fix-Its
we stored. This moves the filter to the application phase, so that we now
store *all* Fix-Its but only apply Fix-Its from errors later on.

This is NFC preparation for an upcoming patch.

2 years agoFix unused-variable error when assertions are disabled
Fix unused-variable error when assertions are disabled

2 years ago[lldb] Make TestExprDiagnostics.py pass again after enabling Fix-Its in test
[lldb] Make TestExprDiagnostics.py pass again after enabling Fix-Its in test

Commit 83c81c0a469482888482983c302c09c02680ae7c enabled Fix-Its for top-level
expressions which change the error message of this test here as Clang comes
up with a strange Fix-It for this expression. This patch just changes the
test to declare a void variable so that Clang doesn't see a way to
recover with a Fix-It and change the error message.

2 years ago[llvm-readobj][test] - Simplify hash-symbols test.
[llvm-readobj][test] - Simplify hash-symbols test.

We are able to reduce `-DBITS=32/64` to reduce this test case.
I've rewrote the comments we had to generalize them and
fix wrong computations they contained.

Differential revision: https://reviews.llvm.org/D76924

2 years ago[X86][AVX] lowerV4X128Shuffle - attempt to widen to 2x256 to simplify shuffles
Simon Pilgrim [Mon, 30 Mar 2020 11:22:06 +0000 (12:22 +0100)]
[X86][AVX] lowerV4X128Shuffle - attempt to widen to 2x256 to simplify shuffles

If we are lowering to X86ISD::SHUF128 we are going to lose track of individual 128-bit lanes that are UNDEF, so if we can widen these to guarantee that they are sequential with their neighbour we should. This helps with later shuffle combines.

2 years ago[clang-format] only parse C# generic type constraints in C#
[clang-format] only parse C# generic type constraints in C#

Commit "[clang-format] Handle C# generic type constraints",
regressed the formatting of code containing `where` as an identifier in other

2 years ago[Matrix] Rename emitChainedMatrixMultiply to emitMatrixMultiply (NFC).
[Matrix] Rename emitChainedMatrixMultiply to emitMatrixMultiply (NFC).

The Chained in the name potentially leads to confusion. Also updated the
comment to drop the unnecessary mention of tile-sized.

2 years ago[AMDGPU] Drop const for value that is copied (NFC).
[AMDGPU] Drop const for value that is copied (NFC).

This fixes

    warning: loop variable 'Def' of type 'const llvm::Register' creates a copy from type 'const llvm::Register' [-Wrange-loop-analysis]

llvm::Register just contains a single unsigned and should be copied.

2 years ago[CVP] Add additional icmp for ranges with undef to test.
[CVP] Add additional icmp for ranges with undef to test.

2 years ago[lldb] Make Fix-Its also apply to top-level expressions
Raphael Isemann [Mon, 30 Mar 2020 09:50:55 +0000 (11:50 +0200)]
Currently top-level expressions won't automatically get Fix-Its applied. The reason
for that is that we only set the `m_fixed_text` member if we have a wrapping
source code (I.e. `m_source_code` is not zero and is wrapping some expressions).

This patch just always sets `m_fixed_text` to get this working.

2 years ago[NFC] [PowerPC] Update and add tests for ori
[NFC] [PowerPC] Update and add tests for ori

Use script to update test for ori with 32-bit imms, and add test for
ori with 64-bit imms.

2 years ago[lldb][NFC] Cleanup Fix-It code
[lldb][NFC] Cleanup Fix-It code

2 years ago[ARM][LowOverheadLoops] Add horizontal reduction support
[ARM][LowOverheadLoops] Add horizontal reduction support

Add a bit more logic into the 'FalseLaneZeros' tracking to enable
horizontal reductions and also make the VADDV variants

Differential Revision: https://reviews.llvm.org/D76708

2 years ago[AST] Fix a crash on invalid bitwidth exprs when preserving the recoveryexprs.
[AST] Fix a crash on invalid bitwidth exprs when preserving the recoveryexprs.

If the bitwith expr contains errors, we mark the field decl invalid.

This patch also tweaks the behavior of ObjCInterfaceDecl to be consistent with
existing RecordDecl -- getObjCLayout method is only called with valid decls.

2 years ago[Analyzer][MallocChecker] No warning for kfree of ZERO_SIZE_PTR.
[Analyzer][MallocChecker] No warning for kfree of ZERO_SIZE_PTR.

The kernel kmalloc function may return a constant value ZERO_SIZE_PTR
if a zero-sized block is allocated. This special value is allowed to
be passed to kfree and should produce no warning.

This is a simple version but should be no problem. The macro is always
detected independent of if this is a kernel source code or any other

2 years ago[mlir] Fix typos in DeclarativeRewrites.md
[mlir] Fix typos in DeclarativeRewrites.md

Differential Revision: https://reviews.llvm.org/D77040

2 years ago[lldb] Run TestFixIts on non-Darwin platforms
[lldb] Run TestFixIts on non-Darwin platforms

This test also passes on my Linux machine, so this seems too strict.

2 years ago[lldb][NFC] Cleanup TestFixIts.py
[lldb][NFC] Cleanup TestFixIts.py

2 years ago[Alignment][NFC] Return Align for SelectionDAGNodes::getOriginalAlignment/getAlignment
[Alignment][NFC] Return Align for SelectionDAGNodes::getOriginalAlignment/getAlignment

Also deprecate getOriginalAlignment, getAlignment will take much more time as it is pervasive through the codebase (including TableGened files).

This is patch is part of a series to introduce an Alignment type.
See this thread for context: http://lists.llvm.org/pipermail/llvm-dev/2019-July/133851.html
See this patch for the introduction of the type: https://reviews.llvm.org/D64790

2 years ago[Analyzer] Rename test `iterator-modelling.cpp` to `iterator-modeling.cpp`
[Analyzer] Rename test `iterator-modelling.cpp` to `iterator-modeling.cpp`

Typo fix.

2 years ago[Analyzer] Fix for incorrect use of container and iterator checkers
[Analyzer] Fix for incorrect use of container and iterator checkers

Iterator checkers (and planned container checkers) need the option
aggressive-binary-operation-simplification to be enabled. Without this
option they may cause assertions. To prevent such misuse, this patch adds
a preventive check which issues a warning and denies the registartion of
the checker if this option is disabled.

Differential Revision: https://reviews.llvm.org/D75171

2 years ago[ARM] MVE VMOV.i64
In the original batch of MVE VMOVimm code generation VMOV.i64 was left
out due to the way it was done downstream. It turns out that it's fairly
simple though. This adds the codegen for it, similar to NEON.

Bigendian is technically incorrect in this version, which John is fixing
in a Neon patch.

2 years ago[TTI][X86] Fix the value passed to IsUnsigned for cost modeling of experimental.vecto...
[TTI][X86] Fix the value passed to IsUnsigned for cost modeling of experimental.vector.reduce.smin/smax/umin/umax.

We were passing true for smax/smin and false for umax/umin.

2 years ago[NFC] Remove obsolete checks followed by fix of isGuaranteedToTransferExecutionToSucc...
[NFC] Remove obsolete checks followed by fix of isGuaranteedToTransferExecutionToSuccessor

In past, isGuaranteedToTransferExecutionToSuccessor contained some weird logic
for volatile loads/stores that was ultimately removed by patch D65375. It's time to
remove a piece of dependent logic that used to be a workaround for the code which
is now deleted.

2 years ago[mlir][NFC] Update dialect/op documentation to be consistent
[mlir][NFC] Update dialect/op documentation to be consistent

This revision performs a lot of different cleanups on operation documentation to ensure that they are consistent, e.g. using mlir code blocks, formatting, etc.

This revision also includes the auto-generated documentation into the hand-written documentation for the dialects that have a specific top-level dialect file. This updates the documentation for all dialects aside from SPIRV and STD. These dialects will be updated in a followup.

Differential Revision: https://reviews.llvm.org/D76734

2 years ago[mlir][NFC] Use the auto-generated op documentation in the standard dialect documentation
[mlir][NFC] Use the auto-generated op documentation in the standard dialect documentation

Summary: This revision updates the dialect documentation to use the auto-generated markdown for operations. This allows for updating some out-of-date bits of documentation, and allows for displaying a large of number of newly added operations that did not have a counter part in Standard.md.

Differential Revision: https://reviews.llvm.org/D76743

2 years ago[mlir][Diagnostics] Don't print note source line if it is the same as the previous...
[mlir][Diagnostics] Don't print note source line if it is the same as the previous diagnostic

Summary: This revision updates the SourceMgrDiagnosticHandler to not print the source location of a note if it is the same location as the previously printed diagnostic. This helps avoid redundancy, and potential confusion, when looking at the diagnostic output.

Differential Revision: https://reviews.llvm.org/D76787

2 years ago[LangRef] Clarify the semantics of branch on undef
[LangRef] Clarify the semantics of branch on undef

This patch clarifies the semantics of branching on undef value.

Defining `br undef` as undefined behavior explains optimizations that use branch conditions, such as CVP (D76931) and GVN (propagateEquality).

For `switch cond`, it is defined to raise UB if cond is an expression containing undef && cond is not frozen &&
it may yield different values.
This allows that at the destination block the branch condition can be assumed to be frozen already (otherwise UB was already triggered).
This condition is slightly stricter than MemorySanitizer, which allows undef-y condition if it always leads to the same destination,
but it does not break MemorySanitizer because we are giving stricter constraint.

2 years agoPR45350: Handle unsized array CXXConstructExprs in constant evaluation
PR45350: Handle unsized array CXXConstructExprs in constant evaluation
of array new expressions with runtime bound.

2 years ago[Coroutines 2/2] Improve symmetric control transfer feature
[Coroutines 2/2] Improve symmetric control transfer feature

Differential Revision: https://reviews.llvm.org/D76913

2 years ago[Coroutines 1/2] Improve symmetric control transfer feature
[Coroutines 1/2] Improve symmetric control transfer feature

Differential Revision: https://reviews.llvm.org/D76911

2 years ago[LLD][ELF] Put back rounding which was lost in 8404aeb56a73ab24f9b295111de3b37a37f0b841
[LLD][ELF] Put back rounding which was lost in 8404aeb56a73ab24f9b295111de3b37a37f0b841

2 years agoRevert "[libc++] NFC: Simplify substitutions by using lit recursive substitutions"
Revert "[libc++] NFC: Simplify substitutions by using lit recursive substitutions"

This reverts commit cd7f9751c30092033a5e97591876f972daf61989 which has
unintended breakage to non-libcxx projects when using the documented way
of building LLVM. (See the Getting Started guide. I.e. one big CMake setup.)

2 years ago[X86] Add sse4.1 RUNs lines to the min/max reduction cost model tests.
[X86] Add sse4.1 RUNs lines to the min/max reduction cost model tests.

Mostly this matches the sse4.2 we already had command lines for.
Except in the i64 case since sse4.1 doesn't have pcmpgtq.

2 years ago[InstCombine] Add tests for trunc (extelt x); (NFC)
[InstCombine] Add tests for trunc (extelt x); (NFC)
Baseline tests for D76983 (PR45314)

Differential Revision: https://reviews.llvm.org/D77024

2 years ago[X86] Add sse4.2 command lines to min/max reduction tests.
[X86] Add sse4.2 command lines to min/max reduction tests.

SSE4.2 has the pcmpgtq instruction which we will use in
vXi64 reductions when its available.

2 years ago[ARMMVE] Create fewer temporary SmallVectors
[ARMMVE] Create fewer temporary SmallVectors

Shrinks clang by 40k.

2 years agoDon't claim template names that name non-templates are undeclared.
Don't claim template names that name non-templates are undeclared.

2 years ago[ELF][test] Improve arm-exidx-output.s to test different output text sections
[ELF][test] Improve arm-exidx-output.s to test different output text sections

Delete arm-exidx-link.s which is now covered by arm-exidx-output.s

Differential Revision: https://reviews.llvm.org/D76409

2 years ago[ARM] VMOV.64 immediate tests. NFC
[ARM] VMOV.64 immediate tests. NFC

2 years ago[gn build] Port 854f268ca62
[gn build] Port 854f268ca62

2 years ago[MC] Move deprecation infos from MCTargetDesc to MCInstrInfo
[MC] Move deprecation infos from MCTargetDesc to MCInstrInfo

This allows emitting it only when the feature is used by a target.
Shrinks Release+Asserts clang by 900k.

2 years ago[clangd] Handle clang-tidy suppression comments for diagnostics inside macro expansions
Nathan Ridge [Sun, 29 Mar 2020 19:13:13 +0000 (15:13 -0400)]
Not handling this was a side-effect of being overly cautious when trying
to avoid reading files for which clangd doesn't have the source mapped.

Fixes https://github.com/clangd/clangd/issues/266

2 years agoclang-format fixes in ClangTidyDiagnosticConsumer.cpp and DiagnosticsTets.cpp
clang-format fixes in ClangTidyDiagnosticConsumer.cpp and DiagnosticsTets.cpp

2 years ago[X86][AVX] Combine 128/256-bit lane shuffles with zeroable upper subvectors to EXTRAC...
[X86][AVX] Combine 128/256-bit lane shuffles with zeroable upper subvectors to EXTRACT_SUBVECTOR (PR40720)

As explained on PR40720, EXTRACTF128 is always as good/better than VPERM2F128/SHUF128, and we can use the implicit zeroing of the uppers.

2 years agoFix -Wdocumentation warning. NFC.
Fix -Wdocumentation warning. NFC.

gcc was misinterpreting the template code snippet as html.

2 years ago[X86] Add isAnyZero shuffle mask helper
Simon Pilgrim [Sun, 29 Mar 2020 17:48:02 +0000 (18:48 +0100)]
[X86] Add isAnyZero shuffle mask helper

2 years ago[InstCombine] Erase old mul when creating umulo
[InstCombine] Erase old mul when creating umulo

As we don't return the result of replaceInstUsesWith(), we are
responsible for erasing the instruction.

There is a small subtlety here in that we need to do this after
the other uses of Builder, which uses the original multiply as
the insertion point.

NFC apart from worklist order changes.

2 years ago[InstCombine] Use replaceOperand() in demanded elements simplification
[InstCombine] Use replaceOperand() in demanded elements simplification

To make sure that dead operands get DCEd. This fixes the largest
source of leftover dead operands we see in tests.

NFC apart from worklist changes.

2 years ago[MLIR] Add missing asserts in interchangeLoops util, doc comment update
[MLIR] Add missing asserts in interchangeLoops util, doc comment update

Add missing assert checks for input to mlir::interchangeLoops utility.
Rename interchangeLoops -> permuteLoops; update doc comments to clarify
inputs / return val. Other than the assert checks, this is NFC.

2 years ago[InstCombine] Use replaceOperand() in assoc cast simplification
[InstCombine] Use replaceOperand() in assoc cast simplification

To make sure the old operands are DCEd.

NFC apart from worklist order.

2 years ago[InstCombine] Erase old add when optimizing add overflow
[InstCombine] Erase old add when optimizing add overflow

We don't return the replaceInstUsesWith() result, so we're
responsible for cleaning up.

NFC apart from worklist order changes.

2 years agoIntroduce support for lib function aligned_alloc in TLI / memory builtins
Introduce support for lib function aligned_alloc in TLI / memory builtins

Aligned_alloc is a standard lib function and has been in glibc since
2.16 and in the C11 standard. It has semantics similar to malloc/calloc
for several analyses/transforms. This patch introduces aligned_alloc
in target library info and memory builtins. Subsequent ones will
make other passes aware and fix https://bugs.llvm.org/show_bug.cgi?id=44062

This change will also be useful to LLVM generators that need to allocate
buffers of vector elements larger than 16 bytes (for eg. 256-bit ones),
element boundary alignment for which is not typically provided by glibc malloc.

2 years agoGlobalISel: Add matcher for G_SHL
GlobalISel: Add matcher for G_SHL

2 years agoAMDGPU/GlobalISel: Remove redundant virtual
AMDGPU/GlobalISel: Remove redundant virtual